Meta、MTIA 300〜500 roadmap公開 自社AI chip展開を加速
Original: Four MTIA Chips in Two Years: Scaling AI Experiences for Billions View original →
MetaはMarch 11, 2026付のAI at Meta Blogで、Meta Training and Inference Accelerator(MTIA)戦略が初期世代のMTIA 100・200から、MTIA 300、400、450、500へと急速に進んでいると説明した。Metaによれば、この4世代はすでに配備済みか、2026または2027の配備を予定しており、billions of people向けのAI機能をより低コストで提供するための中核インフラになるという。
MetaはMTIAをBroadcomと緊密に開発してきた自社AI chip群と位置づけている。すでにhundreds of thousands of MTIA chipsをproductionに投入し、internal production modelsに加えてLlamaのような large language modelsでも評価を進めてきたという。今回の発表で重要なのは、単一設計を長期間使うのではなく、chiplet、network、memory、softwareを短い周期で更新しながらAI workloadの変化に追従する方針を明確にした点だ。
世代ごとの役割もはっきりしている。MTIA 300はranking and recommendation training向けにすでにproductionで動いている。MTIA 400はGenAI workloadへの対応を広げた世代で、72-accelerator scale-up domainを採用し、Metaはleading commercial productsに対抗できる性能を狙うとしている。MTIA 450はさらにGenAI inferenceへ最適化され、MetaによるとMTIA 400比でHBM bandwidthを2倍にし、MX4 FLOPSを75%引き上げ、FP16/BF16比で6xのMX4 FLOPSを実現する。mass deploymentはearly 2027を予定する。
MTIA 500はその方向をさらに押し進める世代だ。MetaはMTIA 450比でHBM bandwidthを追加で50%引き上げ、HBM capacityを最大80%増やし、MX4 FLOPSを43%高めたと述べている。MTIA 300からMTIA 500までを見ると、HBM bandwidthは4.5x、compute FLOPSは25x伸びる計算になる。Metaはこの伸びを、model architectureやserving techniqueが急速に変わる時代には、hardware側もより短いcadenceで進化する必要がある根拠として示している。
software stackでもMetaはPyTorch、vLLM、Triton、Open Compute Projectとの整合性を強調した。モデル移行時に専用環境への大規模なrewriteを避け、GPUとMTIAの両方へproduction modelを載せやすくする狙いだ。今回のpostは、MetaがMTIAを単なるコスト削減用chipではなく、GenAI inferenceを軸に長期的なAI infrastructure stackへ育てようとしていることを示している。
Related Articles
Metaはnext-gen AIの拡張にはcustom siliconが重要だとしてMeta Training and Inference Accelerator(MTIA)のロードマップを公開した。従来のchip cycleより速いmodel architectureの変化に対応するため、2年間で4世代を進めたと説明している。
MetaはPrivate Processing技術(TEE)を活用し、Meta AIとのWhatsApp会話をサーバー側からも読み取れないようにする「Incognito Chat」を5月13日に提供開始した。
5つの大手出版社と作家のスコット・テューロー氏がMetaとマーク・ザッカーバーグ氏個人を訴えた。同氏が海賊サイトから数百万件の著作物を無断ダウンロードしてLlamaのAI学習に使用することを個人的に承認したと主張している。
Comments (0)
No comments yet. Be the first to comment!