OpenAI初のAIチップJalapeno、9カ月テープアウトでLLM推論基盤へ踏み込む
Original: OpenAI builds Jalapeno, its first LLM inference chip with Broadcom View original →
LLM推論を自社設計チップで支える動き
ChatGPT、Codex、API、エージェント製品の利用が増えるほど、OpenAIにとって推論インフラは製品そのものに近い競争要素になる。OpenAIは2026年6月24日のX投稿で、Broadcomと作った初のAIチップJalapenoを明らかにした。汎用アクセラレータを使うだけでなく、LLM推論のワークロードに合わせて下層の計算基盤を設計する動きだ。元の投稿はこちらで読める。
We’ve designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production with @Broadcom, Jalapeño is purpose-built for the LLM workloads powering ChatGPT, Codex, the API, and future agentic products.
リンク先の記事では、JalapenoはOpenAI初のIntelligence Processorと位置づけられている。OpenAIがモデルのロードマップ、カーネル、サービングシステム、製品要件から設計し、Broadcomがシリコン実装とネットワーキング、Celesticaがボードやラックの統合を担う。OpenAIによると、エンジニアリングサンプルは研究室で生産目標の周波数と電力でMLワークロードを動かしており、GPT-5.3-Codex-Sparkも含まれる。
最も具体的な数字は9カ月だ。OpenAIは、Jalapenoが設計から製造テープアウトまで9カ月で進み、高性能ASICとして非常に短い開発サイクルだったと説明する。初期テストでは現行最高水準よりワット当たり性能が大きく良いとしているが、最終性能は測定中で、詳細な技術報告は数カ月後に出すという。
OpenAIの公式アカウントはモデルや製品だけでなく、インフラの方向性も直接示す場になっている。Jalapenoの成否は、API価格、ChatGPTの応答安定性、Codexの長時間実行に跳ね返る可能性がある。次に見るべき点は、公開予定の性能報告が遅延、利用率、ワット当たり性能をどこまで比較可能な形で示すかだ。
Related Articles
安全性評価の焦点が、単発ベンチマークから持続性へ移った。OpenAIは12領域の会話で有益な特性を強化し、敵対的プロンプトや有害な微調整の後も残るかを調べた。
AIによる脆弱性対応の焦点は、発見数から修正までの速度へ移っている。OpenAIはGPT-5.5-CyberがCyberGymで85.6%に達し、Codex Securityが3万超のコードベースを走査したと示した。
Alex Ellisの記事は、local LLMをベンチマーク順位ではなく、事業でのコスト、制御、agent運用の信頼性から捉えた点で読まれた。