Google DeepMindとEMBL-EBI、AlphaFold Databaseに数百万件のprotein complex構造を追加

Google DeepMindは2026年3月17日、XでEMBL-EBI、NVIDIA、ソウル大学との協力によりAlphaFold Databaseへ数百万件のAI-predicted protein complex structuresを追加すると発表した。リンク先のEMBLの発表では、今回の公開を現時点で一般公開されているprotein complex predictionデータセットとして最大級だとしている。

規模は非常に大きい。Google DeepMindはAlphaFold Databaseがすでに世界で330万人超の研究者に使われていると述べ、EMBLは190カ国で340万人超の利用者に提供されてきたと説明した。協力チームはすでに3,000万件のprotein complexes予測を計算しており、最初の公開分は170万件のhigh-confidence homodimersが中心となる。さらに1,800万件のlower-confidence homodimersも発表後まもなくFTP経由で提供される予定だ。

この更新が重要なのは、proteinsが単独で働くことは少なく、多くの生物学的機能がprotein同士の結合や相互作用に依存しているからだ。単一protein構造だけのデータベースでも十分有用だが、大量のprotein complexesまで扱う公開資源はdisease research、drug discovery、基礎的なcell biologyでさらに広い価値を持つ。協力チームはhuman healthとdisease理解に重要なproteinsを優先し、20種の主要生物のhomodimersやWorld Health Organizationのbacterial priority pathogens関連proteinsも含めたと説明している。

インフラ面でも公開の意味は大きい。EMBLによれば、同じ計算を再現するには約1,700万GPU時間が必要になる。これは大半の学術研究室が単独では用意できない規模だ。結果が公開されることで、研究者はパイプライン全体を再現しなくてもprotein interactionの仮説を検証しやすくなる。

AI for science全体で見ると、今回の更新はAlphaFold ecosystemが画期的なデモから継続的に拡張するknowledge platformへ移行していることを示す。研究者がpredicted complexesをexperimental dataと組み合わせて使えるようになれば、AlphaFold Databaseは治療法探索や分子生物学研究の初期段階でさらに重要な公共基盤になる可能性が高い。

Google DeepMindとEMBL-EBI、AlphaFold Databaseに数百万件のprotein complex構造を追加

Related Articles

Google DeepMind、15超の連携でAI生物安全保障を拡張

Google DeepMind、韓国でAI Campus始動へ 8.5万人のAlphaFold基盤を科学連携へ

Google DeepMind、DOE Genesis Missionに$40MのAI credit投入