Anthropic、Claude Opus 4.6とSonnet 4.6を発表 コーディング信頼性を強化
Original: Introducing Claude Opus 4.6 and Sonnet 4.6 View original →
Anthropicは2026年2月18日、「Introducing Claude Opus 4.6 and Sonnet 4.6」を公開し、最新の主力モデル2種を発表した。発表では、両モデルが即時応答とextended thinkingを同一系統で扱えるハイブリッド特性を維持しつつ、実運用で重要になる安定性を改善した点が強調されている。企業導入では単発の応答精度より、長いタスク連鎖での一貫性、再試行コスト、監査可能性が重視されるため、この方向性は実務寄りのアップデートと言える。
AnthropicはOpus 4.6について、SWE-bench 74.5%、Terminal-bench 47.4%(2026年2月17日時点)を示し、コーディング能力の高さを訴求した。Sonnet 4.6はコスト効率と性能のバランスを重視したモデルとして位置づけられている。さらに、コード生成時の近道的な出力を減らし、大規模コードベース理解や複雑な段階推論での整合性を高めたとしている。これらはエージェント型開発フローにおける品質管理に直結する改善点だ。
安全面ではdynamic threat preventionの導入が重要なポイントになった。Anthropicは、プロンプトインジェクションやデータ流出(exfiltration)、エージェント悪用パターンへの対策を強化したと説明する。加えて、Opus 4.5で導入したASL-3のデプロイ保護をOpus 4.6でも維持すると明記した。モデル更新時に安全基準が連続しているかは、規制業種や大企業の採用判断で特に重視されるため、この記述は調達側にとって実用的な情報である。
運用面の拡張として、extended output limitは64k tokensに引き上げられた。長文の分析、コード修正、ドキュメント中心の業務で有効な変更だ。提供経路はAnthropic APIに加え、Amazon Bedrock、Google Cloud Vertex AI、Claude製品群が含まれる。今回の発表は、2026年のLLM競争が単純なベンチマーク比較から、長時間タスク信頼性、セキュリティ統制、マルチクラウド提供の総合力へ移っていることを示している。
Related Articles
AnthropicはClaudeの選挙安全策を数値で公開した。Opus 4.7とSonnet 4.6は600件の選挙ポリシー試験で100%と99.8%の適切応答を示し、米中間選挙関連の質問では92%と95%の割合でウェブ検索を起動した。
なぜ重要か。AIエージェントが会話デモから実際の取引代行へ進み始めたからだ。Anthropicは社内マーケット実験で69体のエージェントが500超の出品から186件をまとめ、取引額は4,000ドルを少し超えたと示した。
HNは一人の解約体験をただの愚痴として流さなかった。高いという不満より、慣れた開発フローの土台が静かに揺れる怖さの方が大きく共有された。
Comments (0)
No comments yet. Be the first to comment!