LLM X/Twitter Mar 6, 2026 1 min read
Google DeepMind는 2026년 3월 3일 X에서 Gemini 3.1 Flash-Lite 출시를 알렸다. 공식 블로그에 따르면 이 모델은 preview로 제공되며, 1M 입력 토큰당 $0.25, 출력 토큰당 $1.50 가격과 저지연 성능을 강조한다.
Google DeepMind는 2026년 3월 3일 X에서 Gemini 3.1 Flash-Lite 출시를 알렸다. 공식 블로그에 따르면 이 모델은 preview로 제공되며, 1M 입력 토큰당 $0.25, 출력 토큰당 $1.50 가격과 저지연 성능을 강조한다.
Alibaba의 Qwen 팀이 Qwen 3.5 Small 모델을 출시했다. r/LocalLLaMA에서 1,000점 이상을 기록한 이 발표는 고성능 소형 모델에 대한 커뮤니티의 높은 관심을 반영한다.
r/LocalLLaMA에서 Qwen3.5-122B-A10B 공개 링크가 빠르게 확산되며, GGUF 배포 시점과 양자화 효율, 실사용 처리량이 주요 화두가 됐다. 모델 카드 기준으로는 122B total / 10B activated MoE 구조, Apache-2.0 라이선스, 262,144 토큰 기본 컨텍스트가 제시됐다.