Google DeepMindとEMBL-EBI、AlphaFold Databaseに数百万件のprotein complex構造を追加
Original: Millions of protein complexes added to AlphaFold Database View original →
Google DeepMindは2026年3月17日、XでEMBL-EBI、NVIDIA、ソウル大学との協力によりAlphaFold Databaseへ数百万件のAI-predicted protein complex structuresを追加すると発表した。リンク先のEMBLの発表では、今回の公開を現時点で一般公開されているprotein complex predictionデータセットとして最大級だとしている。
規模は非常に大きい。Google DeepMindはAlphaFold Databaseがすでに世界で330万人超の研究者に使われていると述べ、EMBLは190カ国で340万人超の利用者に提供されてきたと説明した。協力チームはすでに3,000万件のprotein complexes予測を計算しており、最初の公開分は170万件のhigh-confidence homodimersが中心となる。さらに1,800万件のlower-confidence homodimersも発表後まもなくFTP経由で提供される予定だ。
この更新が重要なのは、proteinsが単独で働くことは少なく、多くの生物学的機能がprotein同士の結合や相互作用に依存しているからだ。単一protein構造だけのデータベースでも十分有用だが、大量のprotein complexesまで扱う公開資源はdisease research、drug discovery、基礎的なcell biologyでさらに広い価値を持つ。協力チームはhuman healthとdisease理解に重要なproteinsを優先し、20種の主要生物のhomodimersやWorld Health Organizationのbacterial priority pathogens関連proteinsも含めたと説明している。
インフラ面でも公開の意味は大きい。EMBLによれば、同じ計算を再現するには約1,700万GPU時間が必要になる。これは大半の学術研究室が単独では用意できない規模だ。結果が公開されることで、研究者はパイプライン全体を再現しなくてもprotein interactionの仮説を検証しやすくなる。
AI for science全体で見ると、今回の更新はAlphaFold ecosystemが画期的なデモから継続的に拡張するknowledge platformへ移行していることを示す。研究者がpredicted complexesをexperimental dataと組み合わせて使えるようになれば、AlphaFold Databaseは治療法探索や分子生物学研究の初期段階でさらに重要な公共基盤になる可能性が高い。
Related Articles
これは単なる地域向けPRではなく、Google DeepMindのAI for Science群を韓国の研究基盤へ引き込む国家連携だ。ソウルのAI Campusを起点にSNU・KAISTとの協力が進み、韓国内で8.5万人超が使うAlphaFoldも出発点に据えられた。
重要なのは、生物学ベンチが整った試験問題から実データ作業へ寄ってきたことだ。AnthropicはClaudeに99件のbioinformatics課題を与え、専門家が解けなかった23問のうち約3割を最新世代が解いたと書いた。
AIのバイオ能力をめぐる議論に、ようやく具体的な数字が入った。AnthropicはClaudeを実データの生物情報学99問で評価し、専門家が詰まった23問の約30%を最近のモデルが解いたと書いた。
Comments (0)
No comments yet. Be the first to comment!