AIがタンパク質運動の完全モデルを初めて生成 (AI generates first complete models of proteins in motion)

ad

2026-05-13 スイス連邦工科大学ローザンヌ校(EPFL)

スイス連邦工科大学ローザンヌ校(EPFL)の研究チームは、人工知能(AI)を用いて、これまで構造解析が困難だったタンパク質アイソフォームの完全モデルを初めて大規模に生成したと発表した。アイソフォームは同一遺伝子から生じる異なるタンパク質変異体であり、疾患や細胞機能に重要な役割を持つが、従来は多くの構造が未解明だった。研究では、深層学習ベースの構造予測技術を活用し、ヒトを含む多数の生物種に存在するアイソフォームの立体構造を網羅的に予測した。これにより、わずかな配列差異がタンパク質機能や相互作用に与える影響を解析可能となった。また、一部アイソフォームでは、従来モデルでは見落とされていた構造変化や機能領域が確認された。研究チームは、この成果が疾患研究、創薬、個別化医療に大きく貢献するとともに、遺伝子発現多様性の理解を深める基盤になると説明している。

AIがタンパク質運動の完全モデルを初めて生成 (AI generates first complete models of proteins in motion)
A simulated protein backbone (yellow) augmented with AI-generated snapshots from the LD-FPG, representing side chain positions and dynamic movements. 2025 LPCS LTS2 EPFL CC BY SA

<関連情報>

グラフ埋め込みにおける潜在拡散を用いた全原子タンパク質構造の生成モデリング Generative Modeling of Full-Atom Protein Conformations using Latent Diffusion on Graph Embeddings

Aditya Sengar, Ali Hariri, Daniel Probst, PATRICK BARTH, Pierre Vandergheynst
Proceedings of NeurIPS 2025

Abstract

Generating diverse, all‐atom conformational ensembles of dynamic proteins such as G‐protein‐coupled receptors (GPCRs) is critical for understanding their function, yet most generative models simplify atomic detail or ignore conformational diversity altogether. We present latent diffusion for full protein generation (LD-FPG), a framework that constructs complete all‐atom protein structures, including every side‐chain heavy atom, directly from molecular dynamics (MD) trajectories. LD-FPG employs a Chebyshev graph neural network (ChebNet) to obtain low‐dimensional latent embeddings of protein conformations, which are processed using three pooling strategies: blind, sequential and residue‐based. A diffusion model trained on these latent representations generates new samples that a decoder, optionally regularized by dihedral‐angle losses, maps back to Cartesian coordinates. Using D2R-MD, a 2μs MD trajectory (12 000 frames) of the human dopamine D2 receptor in a membrane environment, the sequential and residue-based pooling strategies reproduce the reference ensemble with high structural fidelity (all‐atom lDDT \∼ 0.7; Cα-lDDT \∼ 0.8) and recovers backbone and side‐chain dihedral‐angle distributions with a Jensen–Shannon divergence <0.03 compared to the MD data. LD-FPG thereby offers a practical route to system‐specific, all‐atom ensemble generation for large proteins, providing a promising tool for structure‐based therapeutic design on complex, dynamic targets. The D2R-MD dataset and our implementation are freely available to facilitate further research.

細胞遺伝子工学
ad
ad
Follow
ad
タイトルとURLをコピーしました