Liquid AI, 38조 토큰 학습 MoE 모델 공개

엣지 AI의 새 기준

Liquid AI가 LFM2.5 8B-A1B를 공개했다. 2025년 10월 선대 모델 대비 전면 업그레이드된 이번 모델은 엣지 환경에서의 온디바이스 AI를 목표로 설계된 MoE(Mixture of Experts) 아키텍처다. 훈련 데이터는 전작의 12조에서 38조 토큰으로 세 배 이상 늘었다.

핵심 성능 개선

컨텍스트 창이 32K에서 128K로 4배 확장됐고, 어휘 크기는 65K에서 128K로 두 배로 늘었다. 다국어 지원도 대폭 개선됐다—힌디어 +120.4%, 태국어 +238.2%, 베트남어 +117.9% 향상. 추론 루프 문제를 해결하기 위해 확률 재분배 기법을 도입했고, 지식 경계 최적화로 환각 완화도 강화했다.

벤치마크 성적

AA-Omniscience Index에서 -24.70으로 전작 대비 53포인트 개선됐다. IFEval(명령어 따르기) 91.84, MATH500 88.76, AIME25 42.53을 기록했다. 유사한 크기의 밀집 모델을 상회하며, 세 배 이상 큰 Gemma-4-26B와 대등한 수준이다.

추론 속도: M5 Max부터 H100까지

CPU 환경에서는 M5 Max 기준 초당 253토큰을 처리하며, 모바일 기기에서도 초당 약 30토큰을 유지한다. 메모리 소비는 6GB 이하다. GPU 환경에서는 NVIDIA H100에서 초당 1만 8500 출력 토큰, 일일 16억 토큰 이상 처리 능력을 보인다.

배포 지원

llama.cpp, MLX, vLLM, SGLang, ONNX 전부 지원하며, Apple·AMD·Intel·Qualcomm·Nvidia 하드웨어 모두에서 실행 가능하다. 대표 데모 LocalCowork는 13개 서버에 67개 도구를 클라우드 없이 로컬에서 1초 이내 응답으로 처리한다.

Liquid AI, 38조 토큰 학습 MoE 모델 공개

엣지 AI의 새 기준

핵심 성능 개선

벤치마크 성적

추론 속도: M5 Max부터 H100까지

배포 지원

Related Articles

Snyk 300회 반복 테스트, LLM 보안 리뷰의 흔들리는 재현성

LongCat-2.0, 1.6T MoE보다 국산 칩 훈련이 더 큰 신호

Senior SWE-Bench, agent 평가가 '시니어'라는 말에 걸린 이유

Related Articles

Snyk 300회 반복 테스트, LLM 보안 리뷰의 흔들리는 재현성
LLM Jun 29, 2026 2 min read

LongCat-2.0, 1.6T MoE보다 국산 칩 훈련이 더 큰 신호
LLM Hacker News Jul 2, 2026 1 min read

Senior SWE-Bench, agent 평가가 '시니어'라는 말에 걸린 이유
LLM Hacker News Jul 2, 2026 1 min read