arXiv 신규 논문(2605.00842)이 좁은 영역의 무해한 미세조정이 광범위한 정렬 실패를 유발하는 메커니즘을 '특징 중첩 기하학'으로 설명했다. AI 안전 분야의 핵심 미해결 문제에 이론적 근거를 제시한다.
#fine-tuning
RSS Feedr/LocalLLaMA에서 빠르게 퍼진 Unsloth Gemma 4 가이드는 Gemma-4-E2B와 E4B를 8GB VRAM으로 로컬 fine-tuning할 수 있다고 주장한다. 게시물은 약 1.5배 빠른 학습, FA2 대비 약 60% 적은 VRAM, 그리고 초기 Gemma 4 training·inference bug fix를 함께 묶어 practical workflow로 제시한다.
Together AI는 2026년 3월 19일 자사 fine-tuning 서비스가 tool call, reasoning, vision-language workflow를 기본 지원한다고 밝혔다. 연결된 Together AI 블로그는 100B+ parameter 모델, 최대 100GB 데이터셋, 대형 MoE 모델에서 최대 6배 처리량, 학습 전 비용 추정과 실행 중 ETA 제공까지 포함된다고 설명한다.
Together AI는 2026년 3월 19일 fine-tuning 서비스가 tool calling, reasoning, vision-language model 학습을 지원하고 MoE 아키텍처에서 최대 6배 높은 처리량을 낸다고 밝혔다. 공식 글은 최대 1T 파라미터급 모델 지원 방향과 함께 100GB 데이터셋, 사전 비용 추정, 학습 중 ETA 제공을 설명한다.
2026년 3월 17일 r/LocalLLaMA의 Unsloth Studio 글은 최신 사용 가능 크롤 기준 898 points와 236 comments를 기록했다. Unsloth는 Studio를 로컬 추론, 데이터 생성, 파인튜닝, 코드 실행, 모델 내보내기를 한 인터페이스에 담은 베타 웹 UI로 소개한다.
r/MachineLearning 프로젝트 글이 Apple의 MLX stack을 Unsloth 호환 API처럼 감싼 mlx-tune을 조명했다. Apple Silicon Mac에서 SFT, DPO, GRPO, LoRA, vision-language fine-tuning을 로컬로 실험하려는 개발자에게 맞춘 라이브러리다.
r/LocalLLaMA의 한 글은 QLoRA로 조정한 14B Qwen coder가 Ada compilation 작업에서 frontier proprietary model보다 높은 수치를 냈다고 주장하며, niche 언어용 전문 코딩 모델의 가능성을 보여줬다.
Hacker News에서 주목받은 Unsloth의 Qwen3.5 가이드는 모델 크기별 VRAM 요구량, bf16 LoRA 권장 설정, MoE/vision 학습 주의사항을 한 문서로 정리했다.
Unsloth가 맞춤형 Triton 커널을 통해 Mixture of Experts 모델 훈련을 12배 가속하고 VRAM 사용량을 35% 이상 줄이는 획기적인 최적화를 공개했다. 이제 20B 파라미터 모델도 15GB VRAM 미만에서 fine-tuning이 가능하다.