arXiv論文(2605.00842)は、無害なタスクの微細調整がなぜ広範な整合性失敗を引き起こすのかを「特徴量重ね合わせ幾何学」で説明した。AI安全研究の重大な未解決問題に理論的根拠を提示する。
#fine-tuning
RSS Feedr/LocalLLaMA で広がった Unsloth の Gemma 4 ガイドは、Gemma-4-E2B と E4B を 8GB VRAM でローカル fine-tuning できると訴える。投稿では約 1.5 倍の training speed、FA2 比で約 60% 少ない VRAM、そして初期 Gemma 4 の training・inference bug fix を practical workflow としてまとめている。
Together AIは2026年3月19日、自社のfine-tuningサービスがtool call、reasoning、vision-language workflowをネイティブに支援すると発表した。リンク先のTogether AIブログは、100B+ parameter model、最大100GB dataset、大規模MoE modelで最大6倍のthroughput、学習前のcost estimateと実行中のETAまで含まれると説明している。
Together AIは2026年3月19日、fine-tuningサービスがtool calling、reasoning、vision-language model学習に対応し、MoEアーキテクチャで最大6倍高いthroughputを実現すると発表した。公式記事では大規模モデル対応、100GBデータセット、事前コスト見積もり、学習中ETAも説明している。
2026年3月17日のr/LocalLLaMAにおけるUnsloth Studio投稿は、最新利用可能クロールで898 pointsと236 commentsを記録した。UnslothはStudioを、ローカル推論、データ生成、ファインチューニング、コード実行、モデル書き出しを一つにまとめるベータWeb UIとして位置づけている。
r/MachineLearning の project post が、Apple の MLX stack を Unsloth 互換に近い API で包む mlx-tune を紹介した。Apple Silicon Mac 上で SFT、DPO、GRPO、LoRA、vision-language fine-tuning を試したい開発者向けの実用的な bridge だ。
r/LocalLLaMAの投稿は、QLoRAで調整した14B Qwen coderがAda compilation taskでfrontier proprietary modelを上回ると主張し、niche言語向けspecialized coding modelの可能性を示した。
Hacker Newsで注目されたUnslothのQwen3.5ガイドは、モデルサイズ別のbf16 LoRA VRAM目安、MoE学習時の注意点、GGUF/vLLMへの展開手順を整理している。