AIがタンパク質の完全原子モデル生成に成功 (AI generates first complete models of proteins)

ad

2026-05-13 スイス連邦工科大学ローザンヌ校(EPFL)

スイス連邦工科大学ローザンヌ校(EPFL)の研究チームは、人工知能を用いて天然に存在しない新規タンパク質を原子レベルで完全設計する技術を開発した。研究では、タンパク質の立体構造だけでなく、複数タンパク質間相互作用や機能発現まで統合的に予測・生成できるAIモデルを構築。従来のAI設計法は部分構造や限定的機能設計に留まっていたが、新手法では完全なタンパク質複合体を一から生成可能となった。研究チームは、免疫応答制御、酵素設計、分子認識など多様な用途向けタンパク質を生成し、実験的にも安定構造と機能性を確認した。これにより、創薬、バイオ医薬、合成生物学、産業酵素開発などへの応用加速が期待される。研究者らは、AIが生物進化を超える分子設計能力を持ち始めていると指摘している。

AIがタンパク質の完全原子モデル生成に成功 (AI generates first complete models of proteins)
A simulated protein backbone (yellow) augmented with AI-generated snapshots from the LD-FPG, representing side chain positions and dynamic movements. 2025 LPCS LTS2 EPFL CC BY SA

<関連情報>

グラフ埋め込みにおける潜在拡散を用いた全原子タンパク質構造の生成モデリング Generative Modeling of Full-Atom Protein Conformations using Latent Diffusion on Graph Embeddings

Aditya Sengar, Ali Hariri, Daniel Probst, PATRICK BARTH, Pierre Vandergheynst
NeurIPS Proceedings  Published:2025

Abstract

Generating diverse, all‐atom conformational ensembles of dynamic proteins such as G‐protein‐coupled receptors (GPCRs) is critical for understanding their function, yet most generative models simplify atomic detail or ignore conformational diversity altogether. We present latent diffusion for full protein generation (LD-FPG), a framework that constructs complete all‐atom protein structures, including every side‐chain heavy atom, directly from molecular dynamics (MD) trajectories. LD-FPG employs a Chebyshev graph neural network (ChebNet) to obtain low‐dimensional latent embeddings of protein conformations, which are processed using three pooling strategies: blind, sequential and residue‐based. A diffusion model trained on these latent representations generates new samples that a decoder, optionally regularized by dihedral‐angle losses, maps back to Cartesian coordinates. Using D2R-MD, a 2μs MD trajectory (12 000 frames) of the human dopamine D2 receptor in a membrane environment, the sequential and residue-based pooling strategies reproduce the reference ensemble with high structural fidelity (all‐atom lDDT¥∼ 0.7; Cα-lDDT ¥∼ 0.8) and recovers backbone and side‐chain dihedral‐angle distributions with a Jensen–Shannon divergence <0.03 compared to the MD data. LD-FPG thereby offers a practical route to system‐specific, all‐atom ensemble generation for large proteins, providing a promising tool for structure‐based therapeutic design on complex, dynamic targets. The D2R-MD dataset and our implementation are freely available to facilitate further research.

生物化学工学
ad
ad
Follow
ad
タイトルとURLをコピーしました