LLM Reddit Feb 22, 2026 1 min read
Claude Opus 4.6がMETRのソフトウェアタスクベンチマークで50%時間基準として約14.5時間を達成し、全ての予測を上回りました。AI能力の倍増時間が3ヶ月未満とされ、指数的成長が示されています。
Claude Opus 4.6がMETRのソフトウェアタスクベンチマークで50%時間基準として約14.5時間を達成し、全ての予測を上回りました。AI能力の倍増時間が3ヶ月未満とされ、指数的成長が示されています。
Andrej KarpathyがOpenClaw的なAIエージェントシステムの新カテゴリ「Claws」を命名。LLMエージェントがLLMの新レイヤーだったように、ClawsはLLMエージェントの上でオーケストレーション・スケジューリング・永続的コンテキスト管理を担う新レイヤーです。
r/singularityで拡散したAnthropicの2026-02-18研究は、Claude Codeとpublic APIの実データを基に、自律実行時間、auto-approve傾向、リスク領域での利用状況を提示した。
DockerによるNanoClaw実行ガイドがHacker Newsで102ポイントを獲得し、エージェントをホストから分離して運用する実践的な手順として注目されました。特に、ファイルシステム分離とプロキシ経由のAPIキー管理が焦点です。
Anthropicは2026年2月2日、Allen InstituteとHoward Hughes Medical Institute(HHMI)との提携を発表した。multi-agent AIを研究実務に組み込み、解析ボトルネックの短縮と解釈可能性の向上を狙う。