LLM Reddit Apr 30, 2026 1 min read
LocalLLaMA가 Granite 4.1에 반응한 이유는 IBM이 요즘 유행과 반대로 갔기 때문이다. 3B·8B·30B dense 모델을 중심에 두고 instruction following과 tool calling, 운영 비용, 예측 가능한 동작을 전면에 세우자 “실서비스용 모델”로 읽는 반응이 나왔다.
LocalLLaMA가 Granite 4.1에 반응한 이유는 IBM이 요즘 유행과 반대로 갔기 때문이다. 3B·8B·30B dense 모델을 중심에 두고 instruction following과 tool calling, 운영 비용, 예측 가능한 동작을 전면에 세우자 “실서비스용 모델”로 읽는 반응이 나왔다.
r/LocalLLaMA가 IBM의 Granite-4.0-3B-Vision에 주목했다. 이 소형 VLM은 범용 chat보다 chart, table, document key-value extraction에 맞춰 설계됐다.
IBM Granite는 2026-03-20 Mellea 0.4.0과 Granite 4.0 Micro용 Granite Libraries 3종을 공개했다. prompt-only orchestration 대신 구조화되고 safety-aware한 workflow를 만들려는 팀에 초점을 둔 release다.
IBM은 2026년 3월 9일 Granite 4.0 1B Speech를 공개했다. 절반 수준의 파라미터로 이전 모델보다 더 높은 영어 전사 정확도, speculative decoding 기반 빠른 추론, 일본어를 포함한 다국어 지원을 제공한다고 밝혔다.