#fine-tuning

LLM Hacker News Jul 16, 2026 1 min read

Inkling 공개, open-weight 경쟁의 새 기준은 fine-tuning

HN의 관심은 benchmark 1등보다 조합에 모였다. Thinking Machines Lab의 Inkling은 multimodal MoE, 조절 가능한 reasoning effort, Tinker fine-tuning을 한 묶음으로 내세우며 open-weight 모델의 쓰임새를 다시 묻는다.

#thinking-machines #open-weights #multimodal

LLM Jul 4, 2026 1 min read

OpenAI fine-tuning, 60일 미사용 조직은 새 학습 작업 중단

7월 2일부터 최근 60일 동안 fine-tuned model을 inference에 쓰지 않은 조직은 새 fine-tuning job을 만들 수 없다. 2027년 1월 6일에는 활성 기존 고객도 새 작업 생성이 막히며, 기존 fine-tuned model inference는 base model 폐기 전까지 유지된다.

#openai #fine-tuning #api

AI May 8, 2026 1 min read

무해한 미세조정이 왜 정렬 실패를 일으키는가 — 특징 중첩 기하학으로 규명

arXiv 신규 논문(2605.00842)이 좁은 영역의 무해한 미세조정이 광범위한 정렬 실패를 유발하는 메커니즘을 '특징 중첩 기하학'으로 설명했다. AI 안전 분야의 핵심 미해결 문제에 이론적 근거를 제시한다.

#research #safety #fine-tuning

LLM Reddit Apr 8, 2026 1 min read

r/LocalLLaMA가 밀어올린 Gemma 4 로컬 fine-tuning, 8GB VRAM 가이드와 bug fix 묶음

r/LocalLLaMA에서 빠르게 퍼진 Unsloth Gemma 4 가이드는 Gemma-4-E2B와 E4B를 8GB VRAM으로 로컬 fine-tuning할 수 있다고 주장한다. 게시물은 약 1.5배 빠른 학습, FA2 대비 약 60% 적은 VRAM, 그리고 초기 Gemma 4 training·inference bug fix를 함께 묶어 practical workflow로 제시한다.

#gemma-4 #fine-tuning #local-llm

LLM X/Twitter Mar 23, 2026 2 min read

Together AI, tool calling·reasoning·VLM fine-tuning 확대… 100B+ 모델·최대 6배 처리량 지원

Together AI는 2026년 3월 19일 자사 fine-tuning 서비스가 tool call, reasoning, vision-language workflow를 기본 지원한다고 밝혔다. 연결된 Together AI 블로그는 100B+ parameter 모델, 최대 100GB 데이터셋, 대형 MoE 모델에서 최대 6배 처리량, 학습 전 비용 추정과 실행 중 ETA 제공까지 포함된다고 설명한다.

#together-ai #fine-tuning #tool-calling

LLM X/Twitter Mar 22, 2026 1 min read

Together AI, tool calling·reasoning·VLM fine-tuning 확대… 대형 MoE 학습 처리량 6배 향상

Together AI는 2026년 3월 19일 fine-tuning 서비스가 tool calling, reasoning, vision-language model 학습을 지원하고 MoE 아키텍처에서 최대 6배 높은 처리량을 낸다고 밝혔다. 공식 글은 최대 1T 파라미터급 모델 지원 방향과 함께 100GB 데이터셋, 사전 비용 추정, 학습 중 ETA 제공을 설명한다.

#together-ai #fine-tuning #tool-calling

LLM Reddit Mar 19, 2026 2 min read

LocalLLaMA가 밀어올린 Unsloth Studio, 로컬 모델 실행과 학습을 한 화면에 묶는다

2026년 3월 17일 r/LocalLLaMA의 Unsloth Studio 글은 최신 사용 가능 크롤 기준 898 points와 236 comments를 기록했다. Unsloth는 Studio를 로컬 추론, 데이터 생성, 파인튜닝, 코드 실행, 모델 내보내기를 한 인터페이스에 담은 베타 웹 UI로 소개한다.

#unsloth #local-llms #llama-cpp

LLM Reddit Mar 18, 2026 1 min read

r/MachineLearning이 본 mlx-tune, Apple Silicon에서 Unsloth 스타일로 LLM fine-tuning 하기

r/MachineLearning 프로젝트 글이 Apple의 MLX stack을 Unsloth 호환 API처럼 감싼 mlx-tune을 조명했다. Apple Silicon Mac에서 SFT, DPO, GRPO, LoRA, vision-language fine-tuning을 로컬로 실험하려는 개발자에게 맞춘 라이브러리다.

#apple-silicon #mlx #fine-tuning

LLM Reddit Mar 14, 2026 2 min read

LocalLLaMA, safety-critical 소프트웨어용 14B Ada 코딩 모델에 주목

r/LocalLLaMA의 한 글은 QLoRA로 조정한 14B Qwen coder가 Ada compilation 작업에서 frontier proprietary model보다 높은 수치를 냈다고 주장하며, niche 언어용 전문 코딩 모델의 가능성을 보여줬다.

#ada #code-generation #fine-tuning

LLM Hacker News Mar 4, 2026 1 min read

Unsloth, Qwen3.5 파인튜닝 가이드 공개: VRAM 요구량과 실전 설정 정리

Hacker News에서 주목받은 Unsloth의 Qwen3.5 가이드는 모델 크기별 VRAM 요구량, bf16 LoRA 권장 설정, MoE/vision 학습 주의사항을 한 문서로 정리했다.

#qwen #fine-tuning #unsloth

AI Reddit Feb 11, 2026 1 min read

Unsloth, MoE 모델 훈련 속도 12배 향상 및 메모리 35% 절감 달성

Unsloth가 맞춤형 Triton 커널을 통해 Mixture of Experts 모델 훈련을 12배 가속하고 VRAM 사용량을 35% 이상 줄이는 획기적인 최적화를 공개했다. 이제 20B 파라미터 모델도 15GB VRAM 미만에서 fine-tuning이 가능하다.

#moe #fine-tuning #unsloth