Meta、MTIA 300〜500 roadmap公開 自社AI chip展開を加速
Original: Four MTIA Chips in Two Years: Scaling AI Experiences for Billions View original →
MetaはMarch 11, 2026付のAI at Meta Blogで、Meta Training and Inference Accelerator(MTIA)戦略が初期世代のMTIA 100・200から、MTIA 300、400、450、500へと急速に進んでいると説明した。Metaによれば、この4世代はすでに配備済みか、2026または2027の配備を予定しており、billions of people向けのAI機能をより低コストで提供するための中核インフラになるという。
MetaはMTIAをBroadcomと緊密に開発してきた自社AI chip群と位置づけている。すでにhundreds of thousands of MTIA chipsをproductionに投入し、internal production modelsに加えてLlamaのような large language modelsでも評価を進めてきたという。今回の発表で重要なのは、単一設計を長期間使うのではなく、chiplet、network、memory、softwareを短い周期で更新しながらAI workloadの変化に追従する方針を明確にした点だ。
世代ごとの役割もはっきりしている。MTIA 300はranking and recommendation training向けにすでにproductionで動いている。MTIA 400はGenAI workloadへの対応を広げた世代で、72-accelerator scale-up domainを採用し、Metaはleading commercial productsに対抗できる性能を狙うとしている。MTIA 450はさらにGenAI inferenceへ最適化され、MetaによるとMTIA 400比でHBM bandwidthを2倍にし、MX4 FLOPSを75%引き上げ、FP16/BF16比で6xのMX4 FLOPSを実現する。mass deploymentはearly 2027を予定する。
MTIA 500はその方向をさらに押し進める世代だ。MetaはMTIA 450比でHBM bandwidthを追加で50%引き上げ、HBM capacityを最大80%増やし、MX4 FLOPSを43%高めたと述べている。MTIA 300からMTIA 500までを見ると、HBM bandwidthは4.5x、compute FLOPSは25x伸びる計算になる。Metaはこの伸びを、model architectureやserving techniqueが急速に変わる時代には、hardware側もより短いcadenceで進化する必要がある根拠として示している。
software stackでもMetaはPyTorch、vLLM、Triton、Open Compute Projectとの整合性を強調した。モデル移行時に専用環境への大規模なrewriteを避け、GPUとMTIAの両方へproduction modelを載せやすくする狙いだ。今回のpostは、MetaがMTIAを単なるコスト削減用chipではなく、GenAI inferenceを軸に長期的なAI infrastructure stackへ育てようとしていることを示している。
Related Articles
Metaはnext-gen AIの拡張にはcustom siliconが重要だとしてMeta Training and Inference Accelerator(MTIA)のロードマップを公開した。従来のchip cycleより速いmodel architectureの変化に対応するため、2年間で4世代を進めたと説明している。
MetaはMarch 11, 2026、WhatsAppのdevice linking warning、Facebookのsuspicious friend request alert、MessengerでのAI scam review拡大など、新しいanti-scam機能を発表した。Metaは昨年159 million件超のscam adを削除し、scam center関連の10.9 millionアカウントも停止したと説明している。
Metaは2026年3月19日、FacebookとInstagramでMeta AI support assistantの拡大と、より高度なAIベースのcontent enforcement計画を発表した。狙いはsupport応答の高速化とscam・impersonation検知の精度向上だ。
Comments (0)
No comments yet. Be the first to comment!