生成 AI で新種のタンパク質を設計 (U of T Researchers Use Generative AI to Design Novel Proteins )

ad

2023-05-04 カナダ・トロント大学

生成 AI で新種のタンパク質を設計 (U of T Researchers Use Generative AI to Design Novel Proteins )

・ トロント大学が、DALL-E や Midjourney 等の画像作成プラットフォームと同様の技術である拡散モデルを利用して、自然界にはないタンパク質を作成する AI システム、「ProteinSGM」を開発。
・ 新 AI システムは、画像表現から学習して生物物理学的にリアルな新しいタンパク質を超高速で生成する。全く新しい治療用タンパク質の設計や検査を効率的かつ柔軟なものにし、医薬品開発の迅速化に期待されている生成生物学の分野の進展に貢献する。
・ タンパク質はアミノ酸の鎖から作られ、その鎖が三次元の形状に折り畳まれることでその機能が決定する。これらの形状は数十億年をかけて進化し、多様で複雑だがその数には限りがある。タンパク質の折り畳み反応の解明が進み、自然界では生成されない折り畳みパターンの設計が進んでいる。
・ ただし、新しい折り畳みの構造と機能の両方の正確な予測は主要な課題。本研究では、タンパク質構造の生物物理学的表現と画像生成スペースからの拡散手法を組み合わせることで、これらの課題に対処した。
・ 構造を正確にエンコードした既存のタンパク質の画像表現の大規模なセットを利用。これらの画像を生成拡散モデルにフィードすると、各画像に徐々にノイズが加えられ、最終的に全体がノイズとなる。
・ 生成拡散モデルは、画像にノイズが加わって行くプロセスを追跡し、そのプロセスをリバースすることで、ランダムなピクセルを全く新しいタンパク質の明確な画像に変換する方法を学習する。
・ 新たに生成したタンパク質を検証する試験には、DeepMind 社の AlphaFold2 ソフトウェアの改良版である OmegaFold を使用。両プラットフォームは AI を使用してアミノ酸配列をベースにタンパク質の構造を予測する。
・ OmegaFold では、ほぼ全ての新規配列が任意の新しいタンパク質構造に折り畳まれることを確認。それらのいくつかを実際に試験管で生成することで、適切に折り畳まれたタンパク質の構造であることを確認した。
・ 抗体やタンパク質側鎖立体配座を含む他のタンパク質に向け、新 AI システムをさらに向上させる。多くの研究がタンパク質構造を保持する骨組みの一次化学構造に注目している。タンパク質の機能を左右する側鎖立体配座の設計では複雑さが激増するが、適切なエンジニアリングにより可能と考える。
・ 本研究には、カナダ国立健康研究所(CIHR)が資金を提供した。
URL: https://temertymedicine.utoronto.ca/news/u-t-researchers-use-generative-ai-design-novel-proteins
<NEDO海外技術情報より>

関連情報

Nature Computational Science 掲載論文(アブストラクトのみ:全文は有料)
Score-based generative modeling for de novo protein design
URL: https://www.nature.com/articles/s43588-023-00440-3

Abstract

The generation of de novo protein structures with predefined functions and properties remains a challenging problem in protein design. Diffusion models, also known as score-based generative models (SGMs), have recently exhibited astounding empirical performance in image synthesis. Here we use image-based representations of protein structure to develop ProteinSGM, a score-based generative model that produces realistic de novo proteins. Through unconditional generation, we show that ProteinSGM can generate native-like protein structures, surpassing the performance of previously reported generative models. We experimentally validate some de novo designs and observe secondary structure compositions consistent with generated backbones. Finally, we apply conditional generation to de novo protein design by formulating it as an image inpainting problem, allowing precise and modular design of protein structure.

生物工学一般
ad
ad
Follow
ad
タイトルとURLをコピーしました