Ollamaは2026年3月18日、MiniMax-M2.7をcloud経由で提供し、Claude CodeとOpenClawから起動できると発表した。Ollamaのライブラリページは、このモデルをcoding・agent workflow・professional productivity向けと位置づけ、SWE-Pro、VIBE-Pro、Terminal Bench 2、GDPval-AA、Toolathonの成績を示している。
#agents
RSS FeedGitHubは2026-03-09、GitHub Actions上でAgentic Workflowsをどのように隔離し制御するかを詳しく説明した。agentを信頼済みの自動化ではなく、制約前提の非決定的な実行主体として扱っている点が中核だ。
GitHubは2026-03-19、GitHub Copilotベースのオープンソースプロジェクト Squad を紹介した。別個の orchestration stack なしに、リポジトリの中で役割別のAI agentチームを立ち上げる点が中核だ。
Cloudflareは2026年3月19日、Workers AIでMoonshot AIのKimi K2.5提供を開始したと発表した。256k context windowとtool calling、vision、structured outputsを前面に出し、統合agent platform競争へ踏み込む形だ。
OpenAIは2026年3月19日、内部coding agentを監視する運用スタックの詳細を公開した。実運用のdeploymentでmisaligned behaviorを捉えるmodelベースのoversightを、内部agent運用の標準に近づける狙いがある。
Cloudflareは2026年3月11日、AI Security for Appsをgenerally availableにしたと発表した。同時にAI endpoint discoveryをFree、Pro、Businessプランでも無料化し、custom topics detectionとIBM・Wiz連携を追加した。
NVIDIAAIDevはXで、Andrej Karpathyのラボが初のDGX Station GB300を受け取ったと発表した。NVIDIAのGTC更新によると、このdesksideシステムは748GBのcoherent memory、最大20 petaflopsのFP4性能、最大1兆parameterモデル対応を備える。
SkyPilotはClaude Codeが8時間で約910件の autoresearch 実験を回したと説明し、Hacker Newsでは本当の進歩が agent の戦略なのか、インフラなのか、その両方なのかが議論になった。
OpenAIは2026年3月19日、GPT-5.4 Thinkingベースの仕組みで内部coding agentの行動とchain of thoughtを30分以内にレビューする監視体制を公開した。OpenAIは、この仕組みがすでに数千万件のtrajectoryを処理しており、ユーザー意図や社内ポリシーから外れる振る舞いを捉えるためのものだと説明している。
OpenAIは2026年3月17日、GPT-5.4 miniをChatGPT、Codex、APIで利用可能にしたと発表した。投稿ではcoding、computer use、multimodal understanding、subagents向けに最適化し、GPT-5 miniの2倍の速度をうたっている。
2026年3月19日にHacker Newsで注目を集めたagent-satは、weighted MaxSAT benchmarkを相手にAIエージェントが実験とコード改良を繰り返すopen-source projectだ。READMEによれば、2024 MaxSAT Evaluationの229インスタンス中220件を解き、5件でcompetition bestを上回り、1件はnovel solveだという。
GoogleはMar 17, 2026、agent workflow向けのGemini API更新を発表した。built-in toolとcustom functionの同時利用、tool call間でのcontext circulation、Gemini 3向けMaps groundingが加わり、複雑なmulti-stepアプリの実装負荷を下げる内容になっている。