Redditで話題のLiquid AI LFM2.5-350M、350Mパラメータでagentic edgeを狙う

LocalLLaMAで意外なほど強い反応を集めたreleaseの一つが、Liquid AIの LFM2.5-350M だった。このmodelの魅力は frontier-chat performance ではない。350M parameter という小ささで、tool use、structured extraction、edge deployment に合わせて意図的に調整されている点にある。

Liquid AIの2026年3月31日付blog postによれば、新版は pretraining を10Tから28T tokenへ増やし、large-scale reinforcement learning を追加した。会社はこのmodelを function calling、structured output、large-scale data processing 向けに位置づけている。benchmark table は Reddit の見出しより具体的だ。前世代の LFM2-350M と比べると、IFBench は 18.20 から 40.69、CaseReportBench は 11.67 から 32.45、BFCLv3 は 22.95 から 44.11 に改善したとされる。さらに llama.cpp、MLX、vLLM、SGLang、ONNX、OpenVINO を含む day-one support も打ち出している。

このreleaseが信頼しやすいのは、限界を明示している点だ。Liquidは LFM2.5-350M を universal model として売り込まず、math、code、creative writing には推奨しないとしている。つまり戦略は明快で、巨大modelの代替ではなく、反復的な agentic loop や data-heavy な enterprise task を小さな model に任せることだ。Reddit で注目されたのも、この発想が2026年の大きな流れと重なるからだ。すべての仕事を frontier model に寄せるのではなく、edge には小さく速い task-shaped model を置き、本当に必要な場面だけ大きいmodelを呼ぶ構成が現実味を増している。

もし公表された数値が実際の pipeline でも維持されるなら、LFM2.5-350M は parameter count 以上に重要になる。350M model が demo用の toy を超えて、信頼できる tool-use worker になれるかどうか。LocalLLaMA はその可能性をかなり早く見抜いたと言える。

Redditで話題のLiquid AI LFM2.5-350M、350Mパラメータでagentic edgeを狙う

Related Articles

Liquid AI、38Tトークン学習のMoEモデルLFM2.5を公開

Chrome内の小さなGemini Nano、LocalLLaMAが実行条件を検証

Kanbots、各カードにコーディングagentを置くlocal-first Kanban

Comments (0)

Leave a Comment

Related Articles

Liquid AI、38Tトークン学習のMoEモデルLFM2.5を公開
Liquid AIがLFM2.5 8B-A1Bを発表。M5 Maxで毎秒253トークン、モバイルで30トークン、H100で18,500トークンの推論速度を達成し、同サイズの密なモデルを凌駕する性能を示した。

Chrome内の小さなGemini Nano、LocalLLaMAが実行条件を検証

Kanbots、各カードにコーディングagentを置くlocal-first Kanban