生物学エージェント、gget virus追加で精度がほぼ100%へ
Original: Biology agents approach 100% accuracy when deterministic retrieval is added View original →
科学エージェントの実用化では、モデルの賢さより先にデータ基盤が限界になる可能性がある。Anthropicは6月8日の投稿で「Why has AI advanced faster in coding than in biology?」と問い、生命科学データベースはエージェントにとって、人間向けに作られた古い街路のように扱いにくいと説明した。
注目すべき数字は精度だ。リンク先の研究記事では、Claude、Biomni Open Source、Edison Analysis、GPT系のエージェントにNCBI Virusから配列データを取得させたところ、最も強いモデルでも信頼できるデータセット構築に必要な精度へ安定して届かなかった。一方で、決定論的な検索層であるgget virusを加えると、精度はほぼ100%まで上昇した。
AnthropicはClaude、安全性、解釈可能性、信頼できるエージェント設計を継続的に発信している企業だ。今回の投稿は新モデルの投入ではなく、科学AIが現場で失敗する場所を示すものだ。誤ったgenome build、RefSeqとGenBankの混在、不完全なゲノムの扱い、メタデータの不一致は、下流の生物学的解釈を大きく損なう。
次に見るべき点は、生物情報学のデータベースがエージェントから呼び出しやすいAPI、検証可能な検索層、標準化されたワークフローをどこまで整えるかだ。創薬、感染症監視、生物モデリングにAIを入れるなら、推論ベンチマークだけでなく、検索と検算の基盤が成果を左右する。
Related Articles
Microsoft Discoveryが6月2日に一般提供へ移行した。科学・工学R&Dで専門agent、組織知、シミュレーション、検証データをつなぎ、研究者向けローカルアプリもpreviewで公開された。
NMR解析は合成化学の手作業を重くしている。Anthropicは20化合物の評価で、Opus 4.7が水素NMR平均誤差約±0.079 ppmを示し、専用ソフトに並ぶ場面があったと述べた。
Anthropicは2026年3月23日、すべてのlong-horizon taskが多数agentへの分割に向くわけではないと述べた。リンク先の研究記事では、Claude Opus 4.6、persistent memory、orchestration pattern、test oracleを使って differentiable cosmological Boltzmann solver を実装する方法を説明している。