AI Hacker News Mar 2, 2026 1 min read
研究者がApple M4チップのNeural Engineを逆エンジニアリングで分析した結果を公開。CoreMLベースのアーキテクチャ、6.6 FLOPS/Wのエネルギー効率、アイドル時の完全シャットダウン機能などが明らかになった。
研究者がApple M4チップのNeural Engineを逆エンジニアリングで分析した結果を公開。CoreMLベースのアーキテクチャ、6.6 FLOPS/Wのエネルギー効率、アイドル時の完全シャットダウン機能などが明らかになった。
HuaweiのスピンオフであるスマートフォンブランドHonorが初のヒューマノイドロボットを公開した。「フィートスライド」ムーンウォークダンスのデモで披露され、中国のロボット競争に新たな参入者が登場した。
スタートアップTaalasがLLMのウェイトとアーキテクチャをシリコンチップに直接刻み込む急進的なアプローチを公開。Llama 3.1 8BのデモでHBM不要のまま毎秒16,000トークンを達成しましたが、モデルアーキテクチャの急速な進化というリスクがあります。
Hacker Newsで注目されたTaalasの発表は、モデル特化シリコンによる低遅延・低コスト推論を主張する内容。ハードワイヤードLlama 3.1 8Bで17K tokens/sec/ユーザーを掲げた。
Microsoftは2026-01-26にMaia 200(コードネームBraga)を発表した。CopilotおよびAzure AIの一部ワークロードで、Maia 100比最大1.7倍の性能向上を示した。
NVIDIAが次世代AIプラットフォームRubinを発表。Blackwell比で推論トークンコスト10倍削減、MoEモデル訓練GPU数4倍削減を達成し、2026年下半期リリース予定。
NVIDIAがCES 2026で次世代AIプラットフォーム Vera Rubinを公開。MoEモデル学習に必要なGPUを4分の1に削減し、推論トークンコストを10倍削減。2026年下半期リリース予定。