Skip to content

Claude Sonnet 5、Opus級agent性能をFree/Pro標準へ

Original: Introducing Claude Sonnet 5 View original →

Read in other languages: 한국어English
LLM Jul 1, 2026 By Insights AI 1 min read 1 views Source

高価な上位モデルで見せていたagent作業が、利用者の多い標準プランへ降りてきた。AnthropicのClaude Sonnet 5はFreeとProの標準モデルとなり、Max、Team、Enterprise、Claude Code、Claude Platform APIにも同時に入る。注目点は単なる新モデル投入ではない。ブラウザやターミナルを使い、計画を立て、コード変更や知識作業を長く進める能力が、Sonnet価格帯で広く使えるようになる点だ。

Anthropicによると、Sonnet 5はSonnet 4.6に比べてreasoning、tool use、coding、knowledge workを改善した。agentic searchやcomputer useの評価では、前世代Sonnetより広い費用対性能の選択肢を作り、一部の高effort設定ではOpus 4.8に近い水準に届くという。開発者向けにはclaude-sonnet-5がAPIで利用でき、2026年8月31日までは入力100万tokenあたり$2、出力100万tokenあたり$10の導入価格が適用される。その後はそれぞれ$3と$15になる。

プロダクト面ではClaude Codeへの投入が大きい。コードベース調査、テスト作成、バグ修正、pull request処理のような流れでは、短い回答よりも最後まで作業を運ぶ力が重要になる。Anthropicは初期利用者の例として、複雑な技術課題を再現テストから修正、検証まで進めたケースを挙げている。これは独立ベンチマークではないが、Sonnet 5を日常的な自動化層に置く狙いははっきりしている。

安全性については、Sonnet 4.6より望ましくない挙動が少なく、prompt injectionへの耐性や悪意ある依頼の拒否が改善したとされる。一方でAnthropicは、危険なcyber作業能力についてはOpus 4.8やMythos 5より低いと説明する。Firefoxの脆弱性exploit評価ではSonnet系モデルは完全に動くexploitを作れなかったが、Sonnet 5はSonnet 4.6より部分成功率がやや高い。cyber safeguardは標準で有効になる。

実務での焦点は、Sonnet 5がagent workflowを標準運用できるほど安く、安定しているかだ。tokenizer変更や高effort設定の使い方で実コストは変わる。それでも、競争の軸が最上位モデルの性能誇示から、日常プランとAPIで回せるagent能力へ移りつつある。

Share: Long

Related Articles