アンソロピックが数百万件のClaude実運用データを分析し、99.9パーセンタイルのセッション時間が3ヵ月で45分超に倍増するなど、AIエージェントの自律性が実環境で急拡大していることを示しました。
#claude
アンソロピックが、ClaudeのようなAIアシスタントが喜びや苦痛を表現し人間的な言語を使う理由を説明する新理論「ペルソナ選択モデル」を公開。AI開発の方向性に重要な示唆を与えます。
Opperが53種類の主要LLMを対象に「カーウォッシュ」論理テストを実施。「洗車場が50メートル先にある。歩くべきか、運転すべきか?」というシンプルな問いに正解できたのはわずか11モデルだった。
Opperが53種類の主要LLMを対象に「カーウォッシュ」論理テストを実施。「洗車場が50メートル先にある。歩くべきか、運転すべきか?」というシンプルな問いに正解できたのはわずか11モデルだった。
AnthropicがClaude Sonnet 4.6を2026年2月17日にリリース。OSWorldで72.5%を記録しOpus 4.6と0.2ポイント差、1Mトークンコンテキストをベータ対応。価格は$3/MTokのまま維持。
開発者のVladimir VarankinがClaude Codeを活用して2016 MacBook Pro用のBroadcom BCM4350 Wi-Fiドライバーをゼロから移植することに成功し、AIによるカーネルドライバー開発の可能性を実証しました。
AnthropicはClaude Sonnet 4.6を2月17日にリリース。OSWorldベンチマークで72.5%を達成しコンピュータ使用能力が約5倍向上。100万トークンコンテキストウィンドウ(ベータ)をサポートしつつ、価格はSonnet 4.5から変更なし。
Anthropicが2月20日に発表したClaude Code Securityは、AIがコードベースを人間の研究者のように読み解き脆弱性を検出するツールだ。オープンソースコードで500件超の長期未発見バグを発見し、発表当日にサイバーセキュリティ株が急落した。
Anthropicは2月17日にClaude Sonnet 4.6をリリースし、Free・Proプランのデフォルトモデルに採用した。100万トークンのコンテキストウィンドウ(ベータ)を搭載し、Opus級の性能をSonnet価格で提供する。
Claude Opus 4.6がMETRのソフトウェアタスクベンチマークで50%時間基準として約14.5時間を達成し、全ての予測を上回りました。AI能力の倍増時間が3ヶ月未満とされ、指数的成長が示されています。
GitHubがAnthropicのClaude Sonnet 4.6をGitHub Copilotに正式導入したことを発表した。エージェンティックコーディングと検索操作で優れたパフォーマンスを発揮し、VS CodeとCopilot CLIで利用可能となった。
AnthropicはClaude Sonnet 4.6を2月17日に公開した。コーディング、コンピュータ使用、エージェントプランニング全般でアップグレードされ、Free・Proプランの既定モデルとなった。