Skip to content
腐食中

Meta、MTIA 300〜500 roadmap公開 自社AI chip展開を加速

Original: Four MTIA Chips in Two Years: Scaling AI Experiences for Billions View original →

Read in other languages: 한국어English
AI Mar 29, 2026 By Insights AI 1 min read 12 views Source

MetaはMarch 11, 2026付のAI at Meta Blogで、Meta Training and Inference Accelerator(MTIA)戦略が初期世代のMTIA 100・200から、MTIA 300、400、450、500へと急速に進んでいると説明した。Metaによれば、この4世代はすでに配備済みか、2026または2027の配備を予定しており、billions of people向けのAI機能をより低コストで提供するための中核インフラになるという。

MetaはMTIAをBroadcomと緊密に開発してきた自社AI chip群と位置づけている。すでにhundreds of thousands of MTIA chipsをproductionに投入し、internal production modelsに加えてLlamaのような large language modelsでも評価を進めてきたという。今回の発表で重要なのは、単一設計を長期間使うのではなく、chiplet、network、memory、softwareを短い周期で更新しながらAI workloadの変化に追従する方針を明確にした点だ。

世代ごとの役割もはっきりしている。MTIA 300はranking and recommendation training向けにすでにproductionで動いている。MTIA 400はGenAI workloadへの対応を広げた世代で、72-accelerator scale-up domainを採用し、Metaはleading commercial productsに対抗できる性能を狙うとしている。MTIA 450はさらにGenAI inferenceへ最適化され、MetaによるとMTIA 400比でHBM bandwidthを2倍にし、MX4 FLOPSを75%引き上げ、FP16/BF16比で6xのMX4 FLOPSを実現する。mass deploymentはearly 2027を予定する。

MTIA 500はその方向をさらに押し進める世代だ。MetaはMTIA 450比でHBM bandwidthを追加で50%引き上げ、HBM capacityを最大80%増やし、MX4 FLOPSを43%高めたと述べている。MTIA 300からMTIA 500までを見ると、HBM bandwidthは4.5x、compute FLOPSは25x伸びる計算になる。Metaはこの伸びを、model architectureやserving techniqueが急速に変わる時代には、hardware側もより短いcadenceで進化する必要がある根拠として示している。

software stackでもMetaはPyTorch、vLLM、Triton、Open Compute Projectとの整合性を強調した。モデル移行時に専用環境への大規模なrewriteを避け、GPUとMTIAの両方へproduction modelを載せやすくする狙いだ。今回のpostは、MetaがMTIAを単なるコスト削減用chipではなく、GenAI inferenceを軸に長期的なAI infrastructure stackへ育てようとしていることを示している。

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment