重要なのは、エージェント開発の律速段階がモデル速度ではなく人間のコンテキスト切り替えにあるとOpenAIが明言した点だ。OpenAIによれば、Symphony導入後は一部チームでマージ済みPRが500%増え、開発者が無理なく扱えるCodexセッションはおおむね3〜5本だった。
#agents
RSS Feed企業向けAIの勝負は、モデル単体の比較から運用スタック全体の設計へ移っている。Google Cloudは2026年4月24日のCloud Next '26総括で、Gemini Enterprise Agent Platform、Workspace Intelligence、TPU 8t・8i、Virgo Networkを一体のエージェント基盤として打ち出した。
企業向けAIは会話の巧さより、再利用とレビューの仕組みが価値を分ける。Google CloudはGemini Enterpriseでワークフローを共有Skillsとして保存できるようにし、その前日にはAgent Designerで各工程を確認・テスト・承認できると示した。
なぜ重要か。AIエージェントが会話デモから実際の取引代行へ進み始めたからだ。Anthropicは社内マーケット実験で69体のエージェントが500超の出品から186件をまとめ、取引額は4,000ドルを少し超えたと示した。
重要なのは、agentが毎回状態を失う問題をmanaged product側で吸収し始めたことだ。Anthropicは4月23日にpublic betaへ入れ、agentがあらゆるsessionから学べると書いた。
HNはWUPHFを単なる multi-agent デモとして受け取らなかった。各エージェントの notebook から共有 wiki へ事実を昇格させる設計が、いまの agent memory 競争ときれいに重なった。
MetaがAWS Gravitonコアを数千万単位で導入し、AIインフラ競争の主戦場をGPUの外側へ広げた。Metaは、エージェントAIが計画・ツール呼び出し・データ移動といったCPU集約処理を膨らませているとして、Graviton5を次の運用基盤に据える。
LocalLLaMAがこの投稿を押し上げたのは、皆がベンチマークを信じたからではない。27Bのオープンモデルがエージェント型タスクで急に競争圏へ入ったように見え、その重要さと怪しさが同時に出たことで議論が熱くなった。
重要なのは、enterprise OCRの失敗がacademic PDF benchmarkより早くagentを壊すことだ。LlamaIndexはParseBenchがhuman-verifiedの約2,000ページと16.7万超のrulesで14手法をKaggle上で比較すると述べた。
これは単なる利用者数の話ではなく、流通戦略の話だ。OpenAIによると、Codexは4月初旬の週次300万人超から2週間で400万人超へ伸び、その需要をCodex Labsと7社のGSI体制で受け止める構えに入った。
ボトルネックがGPUからAPI層へ移ったため、OpenAIは転送方式そのものを変えた。Responses APIにWebSocketモードと接続スコープのキャッシュを入れたことで、agent workflowはend-to-endで最大40%改善し、GPT-5.3-Codex-Sparkは1,000 TPS、最大4,000 TPSのburstに届いたという。
NVIDIAはHugging FaceでNemotron-Personas-Koreaを公開した。韓国の公的統計に基づく7 million synthetic personasは、agent localizationが翻訳だけでなく地域、敬語、職業、公共サービス文脈まで含むことを示す。