Liquid AI, 38조 토큰 학습 MoE 모델 공개
Original: Liquid AI reveals 8B-A1B MoE trained on 38T View original →
엣지 AI의 새 기준
Liquid AI가 LFM2.5 8B-A1B를 공개했다. 2025년 10월 선대 모델 대비 전면 업그레이드된 이번 모델은 엣지 환경에서의 온디바이스 AI를 목표로 설계된 MoE(Mixture of Experts) 아키텍처다. 훈련 데이터는 전작의 12조에서 38조 토큰으로 세 배 이상 늘었다.
핵심 성능 개선
컨텍스트 창이 32K에서 128K로 4배 확장됐고, 어휘 크기는 65K에서 128K로 두 배로 늘었다. 다국어 지원도 대폭 개선됐다—힌디어 +120.4%, 태국어 +238.2%, 베트남어 +117.9% 향상. 추론 루프 문제를 해결하기 위해 확률 재분배 기법을 도입했고, 지식 경계 최적화로 환각 완화도 강화했다.
벤치마크 성적
AA-Omniscience Index에서 -24.70으로 전작 대비 53포인트 개선됐다. IFEval(명령어 따르기) 91.84, MATH500 88.76, AIME25 42.53을 기록했다. 유사한 크기의 밀집 모델을 상회하며, 세 배 이상 큰 Gemma-4-26B와 대등한 수준이다.
추론 속도: M5 Max부터 H100까지
CPU 환경에서는 M5 Max 기준 초당 253토큰을 처리하며, 모바일 기기에서도 초당 약 30토큰을 유지한다. 메모리 소비는 6GB 이하다. GPU 환경에서는 NVIDIA H100에서 초당 1만 8500 출력 토큰, 일일 16억 토큰 이상 처리 능력을 보인다.
배포 지원
llama.cpp, MLX, vLLM, SGLang, ONNX 전부 지원하며, Apple·AMD·Intel·Qualcomm·Nvidia 하드웨어 모두에서 실행 가능하다. 대표 데모 LocalCowork는 13개 서버에 67개 도구를 클라우드 없이 로컬에서 1초 이내 응답으로 처리한다.
Related Articles
OpenAI가 ChatGPT 기본 모델을 GPT-5.5 Instant으로 교체했다. 의료·법률·금융 등 고위험 분야에서 환각 오류가 52.5% 줄었고, 응답 길이도 30.2% 단축됐다.
DELEGATE-52 연구에 따르면 Gemini 3.1 Pro, Claude 4.6 Opus, GPT 5.4 등 최첨단 LLM도 긴 위임 워크플로우에서 문서 내용의 평균 25%를 조용히 손상시킨다.
에이전트 벤치마크 FoodTruck Bench에서 DeepSeek V4 Pro가 GPT-5.2와 사실상 동등한 성능을 기록했다. GPT-5.2 테스트 대비 10주 만에, 비용은 약 17배 저렴하다.
Comments (0)
No comments yet. Be the first to comment!