OpenAIは2026年3月17日、GPT-5.4 miniをChatGPT、Codex、APIで利用可能にしたと発表した。投稿ではcoding、computer use、multimodal understanding、subagents向けに最適化し、GPT-5 miniの2倍の速度をうたっている。
#agents
RSS Feed2026年3月19日にHacker Newsで注目を集めたagent-satは、weighted MaxSAT benchmarkを相手にAIエージェントが実験とコード改良を繰り返すopen-source projectだ。READMEによれば、2024 MaxSAT Evaluationの229インスタンス中220件を解き、5件でcompetition bestを上回り、1件はnovel solveだという。
GoogleはMar 17, 2026、agent workflow向けのGemini API更新を発表した。built-in toolとcustom functionの同時利用、tool call間でのcontext circulation、Gemini 3向けMaps groundingが加わり、複雑なmulti-stepアプリの実装負荷を下げる内容になっている。
2026年3月18日のNVIDIA NemoClawに関するHacker News投稿は231 points、185 commentsに達した。このalpha projectはNVIDIA OpenShellとAgent Toolkitの上にOpenClawを載せ、policy controlとcloud-routed inferenceを備えたsandboxed environmentでalways-on assistantを動かす構成を打ち出している。
MistralAIは2026年3月17日、企業がproprietary knowledgeを基盤にfrontier-grade AIモデルを構築できるForgeを発表した。公式記事では、pre-training、post-training、reinforcement learning、agent-firstな設計、複数アーキテクチャ対応、規制環境向けの統制まで含む基盤として説明している。
OpenAIは2026年3月9日、Promptfooを買収すると発表した。OpenAIはPromptfooの技術がOpenAI Frontierにおけるagentic security testingとevaluation能力を強化すると説明し、Promptfooは現行ライセンスのままopen sourceを維持し、既存顧客へのサポートも継続すると述べた。
GitHubはMarch 11, 2026、JetBrains IDE向けCopilotの大規模アップデートを発表した。custom agents、sub-agents、plan agentがgenerally availableになり、agent hooks、MCP auto-approve、AGENTS.md・CLAUDE.md対応も加わった。
Perplexityは2026年3月11日、search、tool execution、multi-model orchestrationをまとめたAgent APIを発表した。今回の公開によって、Perplexityは単なるanswer interfaceよりも、production agent workflow向けのruntime providerとしての色を強めている。
Perplexityは2026年3月12日のX投稿で、ComputerをPro subscriberにも開放したと発表した。20超のadvanced models、prebuilt/custom skills、hundreds of connectorsを訴求しつつ、Max subscriberにはmonthly creditsとより高いspend limitを用意すると説明している。
OpenAIは2026年3月11日、AI agentが読むemail、web page、calendar inviteのようなuntrusted contentを主要なsecurity boundaryとして扱う新ガイドを公開した。堅牢なagentはdataとinstructionを分離し、least privilegeを徹底し、重要なactionの前にmonitoringとuser confirmationを入れるべきだとしている。
PerplexityはMarch 13, 2026のX postで、Perplexity ComputerがPerplexity app内のiOSで利用可能になったと発表した。前日のPro subscribers向け提供開始に続き、mobile control surfaceまで追加されたことで、Computerを長時間動くagent workflowとして押し出す流れがより明確になった。
2026年3月14日のHacker Newsでは、ローカル stdio MCP は過剰になり得る一方、リモート HTTP MCP は認証、telemetry、共有ツール基盤で依然重要だという、より整理された議論が注目された。