ローカルmultimodal AIの競争が12B級へ入った。Google GemmaはGemma 4 12BをApache 2.0で公開し、画像・音声・テキストを統合的に扱うencoder-free設計を示した。
ローカルmultimodal AIの競争が12B級へ入った。Google GemmaはGemma 4 12BをApache 2.0で公開し、画像・音声・テキストを統合的に扱うencoder-free設計を示した。
NVIDIAはCosmos 3を物理AI向けのオープンomnimodelとして公開した。SuperとNanoに加え、6種類の合成データセット、Hugging Faceチェックポイント、GitHubレシピが示された。
DeepSeekはV4-Pro APIの75%割引を恒久価格に切り替え、LLM APIの価格競争を一段押し下げた。投稿画像では出力単価が100万トークンあたり$3.48から$0.87に下がる。
LocalLLaMAが強く反応したのは、DeepSeekが点とボックスを推論単位に持ち上げたからだ。直後にリポジトリが非公開になり、注目はさらに膨らんだ。
LocalLLaMAがGranite 4.1に反応したのは、IBMがいまの流行と逆の方向へ振ったからだ。3B・8B・30Bのdenseモデルを中心に、instruction following、tool calling、運用コスト、予測可能な挙動を前面に出し、「実サービス向け」の空気が強かった。
重要なのは、Moonshotが“agent swarm”をdemo wordではなく実行スケールの数字で押し出していることだ。Kimiのpostは、1回のrunで300 sub-agentと4,000 stepを回し、chatではなく100超のfilesを返せるとした。
PrismMLは、open modelを小さくする鍵がarchitectureだけでなくweight formatにもあると示した。Ternary Bonsaiは1.58 bitsで8B、4B、1.7Bを出し、8B variantは1.75GBとされている。
ポイントは、量子計算を研究室のデモではなく公開モデル・benchmark・code stack に変えようとしている点だ。4月14日の投稿は Ising を open suite として取り上げ、NVIDIAの技術文書は Ising Calibration 1 が QCalEval で GPT-5.4 を14.5%、Gemini 3.1 Pro を3.27%上回ったと示した。
NVIDIAが量子チップの校正と誤り訂正を開放型AIスタックとしてまとめた。QCalEvalではGPT 5.4を14.5%上回り、デコーディング側では2.25x高速化まで示しており、量子計算で最もしんどいソフトウェアの詰まりが実運用寄りに一歩動いた形だ。
Google AI Edge TeamはApril 2, 2026、Gemma 4がApache 2.0 licenseの下でphone、desktop、edge hardwareへmulti-step agentic workflowを持ち込むと発表した。今回のlaunchはopen models、Agent Skills、LiteRT-LM deployment toolingを組み合わせている。
1247ポイント、328コメントのHacker Newsスレッドで、AISLEはscoped contextがあれば小さなopen-weight modelでもMythos級のexploit analysisの一部を再現できると主張し、コメント欄はmethodologyを巡って大きく割れた。
Hacker Newsで大きく読まれたAISLEの投稿は、Anthropic Mythosの発表がAI securityという領域の現実性を示した一方で、優位性が特定のmodelだけに閉じているとは言えないと論じる。適切なcode pathを切り出せば、小型のopen modelでも重要な分析をかなり再現できたという主張だ。