NVIDIAが「Star Elastic」発表——30B・23B・12Bの3モデルを1チェックポイントに統合

Original: NVIDIA AI Releases Star Elastic: One Checkpoint that Contains 30B, 23B, and 12B Reasoning Models with Zero-Shot Slicing View original →

Read in other languages: 한국어 English

AI May 10, 2026 By Insights AI (Reddit) 1 min read Source

Star Elasticとは

NVIDIA AIが公開したStar Elasticは、30B・23B・12Bの推論モデルを1つのチェックポイントファイルに収めた革新的なアーキテクチャだ。マトリョーシカ人形のように大きなモデルの中に小さなモデルが入れ子になっており、1つのファイルをダウンロードするだけで3つのスケールすべてにアクセスできる。

ゼロショットスライシング

核心機能はゼロショットスライシングだ。追加のファインチューニングやダウンロードなしに、30Bモデルから12Bモードへ瞬時に切り替えられる。モデルがKVキャッシュを共有しているため、30Bで推論経路を探索し、12Bで高速に展開し、再び30Bで評価するハイブリッドワークフローも理論上可能だ。

DenseとMoEの中間

r/LocalLLAMAコミュニティはこのアーキテクチャをDenseモデルと混合エキスパート（MoE）の中間と捉えている。エキスパートにルーティングする代わりに、レイヤーを動的に削ってスケールを縮小する。スケーラブルビデオコーディングで1つのストリームからUHD/HD/SDを生成するのに似た概念だ。

ローカル実行

NVIDIAはローカル展開を念頭にStar Elasticを設計した。12Bモードは一般消費者向けGPUでも動作し、高VRAM環境では30Bの全容量を活用できる。共有チェックポイント設計によりストレージも節約でき、1回のダウンロードで3つのティアすべてをカバーする。

#nvidia #star-elastic #llm #model-architecture #local-llm

Share: Long

Related Articles

AI 5d ago 1 min read

NVIDIA Nemotron 3 Nano Omni公開 — ビジョン・音声・言語統合の30Bオープンモデル、同クラス比9倍スループット

NVIDIAが4月28日に30BパラメータのマルチモーダルオープンモデルNemotron 3 Nano Omniを公開。視覚・音声・言語を単一モデルで処理し、同クラスオープンモデルより9倍高いスループットを実現。

#nvidia #open-source #multimodal

4

AI Reddit 6d ago 1 min read

AMD Ryzen AI Max Pro 495が192GB統合メモリでリーク、ローカルAIの限界を押し上げる

AMD Ryzen AI Max Pro 495（Gorgon Halo）が192GBの統合メモリを搭載することがリークされた。現行Strix Haloの128GBから50%増で、より大型のAIモデルをローカルで動作させることが可能になる。

#amd #ryzen-ai #hardware

4

AI May 3, 2026 1 min read

米国防総省、７社のAIを機密軍事ネットワークへ展開承認——Anthropicは除外

米国防総省が5月1日、Amazon、Google、Microsoft、NVIDIA、OpenAI、SpaceX、Reflection AI 7社と機密ネットワークへのAI展開協定を締結。自律型兵器への安全基準を主張したAnthropicは対象外となった。

#openai #google #microsoft

4

Comments (0)

No comments yet. Be the first to comment!