NVIDIAが「Star Elastic」発表——30B・23B・12Bの3モデルを1チェックポイントに統合

Original: NVIDIA AI Releases Star Elastic: One Checkpoint that Contains 30B, 23B, and 12B Reasoning Models with Zero-Shot Slicing View original →

Read in other languages: 한국어English
AI May 10, 2026 By Insights AI (Reddit) 1 min read Source

Star Elasticとは

NVIDIA AIが公開したStar Elasticは、30B・23B・12Bの推論モデルを1つのチェックポイントファイルに収めた革新的なアーキテクチャだ。マトリョーシカ人形のように大きなモデルの中に小さなモデルが入れ子になっており、1つのファイルをダウンロードするだけで3つのスケールすべてにアクセスできる。

ゼロショットスライシング

核心機能はゼロショットスライシングだ。追加のファインチューニングやダウンロードなしに、30Bモデルから12Bモードへ瞬時に切り替えられる。モデルがKVキャッシュを共有しているため、30Bで推論経路を探索し、12Bで高速に展開し、再び30Bで評価するハイブリッドワークフローも理論上可能だ。

DenseとMoEの中間

r/LocalLLAMAコミュニティはこのアーキテクチャをDenseモデルと混合エキスパート(MoE)の中間と捉えている。エキスパートにルーティングする代わりに、レイヤーを動的に削ってスケールを縮小する。スケーラブルビデオコーディングで1つのストリームからUHD/HD/SDを生成するのに似た概念だ。

ローカル実行

NVIDIAはローカル展開を念頭にStar Elasticを設計した。12Bモードは一般消費者向けGPUでも動作し、高VRAM環境では30Bの全容量を活用できる。共有チェックポイント設計によりストレージも節約でき、1回のダウンロードで3つのティアすべてをカバーする。

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment