Google DeepMindとEMBL-EBI、AlphaFold Databaseに数百万件のprotein complex構造を追加
Original: Millions of protein complexes added to AlphaFold Database View original →
Google DeepMindは2026年3月17日、XでEMBL-EBI、NVIDIA、ソウル大学との協力によりAlphaFold Databaseへ数百万件のAI-predicted protein complex structuresを追加すると発表した。リンク先のEMBLの発表では、今回の公開を現時点で一般公開されているprotein complex predictionデータセットとして最大級だとしている。
規模は非常に大きい。Google DeepMindはAlphaFold Databaseがすでに世界で330万人超の研究者に使われていると述べ、EMBLは190カ国で340万人超の利用者に提供されてきたと説明した。協力チームはすでに3,000万件のprotein complexes予測を計算しており、最初の公開分は170万件のhigh-confidence homodimersが中心となる。さらに1,800万件のlower-confidence homodimersも発表後まもなくFTP経由で提供される予定だ。
この更新が重要なのは、proteinsが単独で働くことは少なく、多くの生物学的機能がprotein同士の結合や相互作用に依存しているからだ。単一protein構造だけのデータベースでも十分有用だが、大量のprotein complexesまで扱う公開資源はdisease research、drug discovery、基礎的なcell biologyでさらに広い価値を持つ。協力チームはhuman healthとdisease理解に重要なproteinsを優先し、20種の主要生物のhomodimersやWorld Health Organizationのbacterial priority pathogens関連proteinsも含めたと説明している。
インフラ面でも公開の意味は大きい。EMBLによれば、同じ計算を再現するには約1,700万GPU時間が必要になる。これは大半の学術研究室が単独では用意できない規模だ。結果が公開されることで、研究者はパイプライン全体を再現しなくてもprotein interactionの仮説を検証しやすくなる。
AI for science全体で見ると、今回の更新はAlphaFold ecosystemが画期的なデモから継続的に拡張するknowledge platformへ移行していることを示す。研究者がpredicted complexesをexperimental dataと組み合わせて使えるようになれば、AlphaFold Databaseは治療法探索や分子生物学研究の初期段階でさらに重要な公共基盤になる可能性が高い。
Related Articles
これは単なる地域向けPRではなく、Google DeepMindのAI for Science群を韓国の研究基盤へ引き込む国家連携だ。ソウルのAI Campusを起点にSNU・KAISTとの協力が進み、韓国内で8.5万人超が使うAlphaFoldも出発点に据えられた。
Google Researchは、皮膚症状を調べるAIを病名候補だけで測らず、利用者が次の行動を選べるかまで見た研究を示した。JAMA Dermatologyの2,345人調査と混合研究を合わせ、医療AI評価の焦点が利用者理解へ移っている。
生命科学向けAIの評価が、研究現場に近い課題へ寄ってきた。OpenAIは、バイオ・製薬分野の科学者173人と7つの研究ワークフローにまたがる750課題を作ったとしている。