NVIDIAが「Star Elastic」発表——30B・23B・12Bの3モデルを1チェックポイントに統合
Original: NVIDIA AI Releases Star Elastic: One Checkpoint that Contains 30B, 23B, and 12B Reasoning Models with Zero-Shot Slicing View original →
Star Elasticとは
NVIDIA AIが公開したStar Elasticは、30B・23B・12Bの推論モデルを1つのチェックポイントファイルに収めた革新的なアーキテクチャだ。マトリョーシカ人形のように大きなモデルの中に小さなモデルが入れ子になっており、1つのファイルをダウンロードするだけで3つのスケールすべてにアクセスできる。
ゼロショットスライシング
核心機能はゼロショットスライシングだ。追加のファインチューニングやダウンロードなしに、30Bモデルから12Bモードへ瞬時に切り替えられる。モデルがKVキャッシュを共有しているため、30Bで推論経路を探索し、12Bで高速に展開し、再び30Bで評価するハイブリッドワークフローも理論上可能だ。
DenseとMoEの中間
r/LocalLLAMAコミュニティはこのアーキテクチャをDenseモデルと混合エキスパート(MoE)の中間と捉えている。エキスパートにルーティングする代わりに、レイヤーを動的に削ってスケールを縮小する。スケーラブルビデオコーディングで1つのストリームからUHD/HD/SDを生成するのに似た概念だ。
ローカル実行
NVIDIAはローカル展開を念頭にStar Elasticを設計した。12Bモードは一般消費者向けGPUでも動作し、高VRAM環境では30Bの全容量を活用できる。共有チェックポイント設計によりストレージも節約でき、1回のダウンロードで3つのティアすべてをカバーする。
Related Articles
NVIDIAが4月28日に30BパラメータのマルチモーダルオープンモデルNemotron 3 Nano Omniを公開。視覚・音声・言語を単一モデルで処理し、同クラスオープンモデルより9倍高いスループットを実現。
AMD Ryzen AI Max Pro 495(Gorgon Halo)が192GBの統合メモリを搭載することがリークされた。現行Strix Haloの128GBから50%増で、より大型のAIモデルをローカルで動作させることが可能になる。
米国防総省が5月1日、Amazon、Google、Microsoft、NVIDIA、OpenAI、SpaceX、Reflection AI 7社と機密ネットワークへのAI展開協定を締結。自律型兵器への安全基準を主張したAnthropicは対象外となった。
Comments (0)
No comments yet. Be the first to comment!