Andrej Karpathyが、縮小版nanochat training loopをAI agentがovernightで反復実験できるautoresearch repoを公開した。固定5分run、Git branch、validation lossベースの選別を組み合わせ、agent研究をclosed-loop workflowに変える試みだ。
Andrej Karpathyが、縮小版nanochat training loopをAI agentがovernightで反復実験できるautoresearch repoを公開した。固定5分run、Git branch、validation lossベースの選別を組み合わせ、agent研究をclosed-loop workflowに変える試みだ。
注目を集めたHacker News threadは、coding agentがliterate programming最大のコストだったproseとcodeの同期負担を減らせるという見方を押し上げた。記事はOrg Mode型runbookとexecutable documentationがAI-assisted software workflowにより適する可能性を示している。
AzureがGPT-5.4のMicrosoft Foundryでの一般提供開始を発表した。Microsoftは、より安定した multi-step execution と governance controls を前面に出し、GPT-5.4 Pro、価格、初期展開オプションも公開した。
OpenAI DevelopersがGPT-5.4 API向けのプロンプトガイドを更新した。tool use、structured outputs、verification loops、長時間ワークフローの設計を整理し、production-grade agentsの安定運用を狙う内容だ。
AnthropicはFebruary 17, 2026にClaude Sonnet 4.6を発表し、betaの1M token context windowを追加した。API価格を$3/$15 per million tokensに据え置いたままclaude.aiとClaude Coworkの標準モデルを更新し、より多くの実務ワークロードをSonnet系へ寄せる意図を示した。
Hacker Newsで注目されたAndrej KarpathyのAutoresearchは、agentが1つの学習ファイルを編集し、5分固定の実験を繰り返して`val_bpb`が改善した変更だけを残す最小構成の研究自動化環境だ。
AmazonとOpenAIが複数年の戦略提携を発表した。AWSをOpenAIのexclusive third-party cloudに据え、BedrockにOpenAI GPTを導入し、agent向けstateful runtimeもあわせて提供する。
OpenAIとAmazonは、AWS顧客向けにAmazon Bedrock上でproduction-grade agent workflowsを動かすStateful Runtime Environmentを提供すると発表した。persistent state、governance、long-running workflow対応をAWSの管理インフラ側に引き寄せる動きといえる。
Microsoft Researchは2026年2月26日にCORPGENを発表した。実際のオフィス業務を模した高負荷マルチタスク条件で、ベースライン比最大3.5倍の完了率を報告している。
Microsoft Researchは2026年2月26日にCORPGENを発表した。実際のオフィス業務を模した高負荷マルチタスク条件で、ベースライン比最大3.5倍の完了率を報告している。
OpenAIはOperatorのアップグレードを発表し、Google DriveでのSlides作成・編集とBrowser内Jupyter modeでのコード実行を追加した。あわせて直近数週間で20地域への提供拡大と、韓国を含む追加国展開を示した。
AnthropicがClaude Coworkエンタープライズプラグインを発表し、Microsoft Excel、PowerPoint、Slack、Gmail、Google DriveなどにClaudeを直接組み込み、クロスアプリ自律ワークフローを実現する。