Claude Opus 4.7、NMR 20化合物評価で専用ソフトに迫る結果
Original: Claude Opus 4.7 Beats NMR Software on Parts of Chemistry Benchmark View original →
化学実験の待ち時間を減らせるか
NMRスペクトルの読み取りは、合成化学で避けにくい手作業のひとつだ。研究者は分子を直接見るのではなく、ピークの位置や形を原子に対応づけて構造を確かめる。Anthropicは公式Xで、Claude Opus 4.7をこの解析に使った新しいScience Blogを示した。
"Opus 4.7 matches—and on some tasks beats—dedicated NMR software."
この投稿は2026年6月5日19:27 UTCに公開され、FxTwitter確認時点で36万回超の表示と3,300件超のいいねを集めていた。Anthropicの公式アカウントはClaudeの製品更新だけでなく、安全性、解釈可能性、評価研究も継続的に扱うため、今回の投稿は研究ベンチマークとして読む価値がある。
リンク先の研究では、Opus 4.7、Opus 4.6、Sonnet 4.6をChemDrawとMestReNovaに対して比較した。対象はモデルの学習カットオフ後に出た合成化学プレプリントから選んだ20化合物で、既知データを覚えていた可能性を下げる設計になっている。水素NMRではOpus 4.7の平均誤差が約±0.079 ppmで、Anthropicが示す許容幅の半分を下回った。炭素NMRではOpus 4.7が±1.37 ppm、MestReNovaが±1.48 ppmで、ほぼ同等だった。
注目点は逆方向の構造推定にも踏み込んだことだ。従来の専用ソフトは、候補構造を入力して予想スペクトルを出す順方向の作業に強い。一方で現場では、実験スペクトルから構造を推定する逆問題が重要になる。Anthropicによると、Opus 4.7は簡単な8件について、スペクトルと分子式だけで全試行に成功した。
次に見るべきは、評価範囲の広がりである。今回のデータは順方向20化合物、逆方向15問題に限られる。実験室での信頼性を判断するには、より多様な骨格、ノイズを含む実測データ、2D NMR、外部化学者によるブラインド比較が必要になる。
Related Articles
AIのバイオ能力をめぐる議論に、ようやく具体的な数字が入った。AnthropicはClaudeを実データの生物情報学99問で評価し、専門家が詰まった23問の約30%を最近のモデルが解いたと書いた。
Anthropicは2026年3月23日、AIが研究実務とscientific discoveryをどう変えるかに焦点を当てたScience Blogを立ち上げると発表した。新しいblogはfeature、workflow guide、field noteを通じてAnthropicのAI-for-science戦略を継続的なプログラムとして見せている。
Anthropicは2026年3月23日、すべてのlong-horizon taskが多数agentへの分割に向くわけではないと述べた。リンク先の研究記事では、Claude Opus 4.6、persistent memory、orchestration pattern、test oracleを使って differentiable cosmological Boltzmann solver を実装する方法を説明している。