2024-01-04 静岡県立大学,科学技術振興機構
発表のポイント
- タンパク質機能の向上が期待される有用変異点の同定と、多点変異組み合わせ最適化を行う進化的アルゴリズム (GA) を基盤とするタンパク質デザイン法「GAOptimizer (ジーエーオプティマイザー) 法」を開発しました。
- GAOptimizer法を用いて異なる3つのファミリーに属する酵素群の高機能化に成功しました。
- 本法を用いることで、産業応用のポテンシャルを秘めた数多くのタンパク質の高機能化が達成し、タンパク質を用いた次世代生体素材の開発が加速すると期待されます。
図1. GAOptimizerの概略。GAOptimizerは高機能化させたいタンパク質の立体構造 (鋳型構造) とそのホモログ1)のタンパク質アミノ酸配列を入力データとし、N世代のバーチャル進化を行う。進化後の各世代のエリート構造が出力結果として保存される。N数はユーザーが自由に設定できる。
概要
多様な機能を持つタンパク質は、次世代生体素材の1つとして注目されています。一方で応用利用に適した機能を有する天然由来タンパク質を取得することは難しく、多くの場合はその機能を目的に応じて向上させる必要があります。タンパク質工学2)は上記課題を解決できる手法の1つであり、AIを始めとした情報科学技術を活用した高機能化タンパク質デザイン法の開発が世界的にも進展しています。
静岡県立大学の中野祥吾准教授および小澤洋樹さん(博士前期課程1年)らの研究チームは、コンピュータ内でタンパク質をバーチャル進化させることで、高機能なタンパク質をデザインできる新たな手法「GAOptimizer法」を開発しました。構造・配列・機能が異なる3種類のタンパク質に本法を適用してデザインした人工タンパク質は、鋳型とした天然由来タンパク質と比べて応用利用に適した優れた機能を有することを実験的に確認しました。
今回の成果は、産業応用のポテンシャルを秘めた天然由来タンパク質の高機能化デザインを可能とし、タンパク質を用いた次世代生体素材の開発を加速することが期待されます。一例としてグリーントランスフォーメーションを実現するための基盤となる高機能化酵素の開発への応用が考えられます。本成果は2024年1月3日に米国の科学雑誌『Cell Reports Physical Science』に掲載されました。
研究の背景と経緯
タンパク質は生物を構成する生体高分子であり、代謝を始めとする生命現象を担う重要な物質の1つです。近年のバイオテクノロジーの進展は、生体内に少量しか存在しないタンパク質の大量生産を可能にしました。このような技術の発展により、タンパク質を次世代生体素材として応用できる環境が整いつつあります。事実、タンパク質の1つである酵素を利用した光学活性化合物の合成や、組み換え抗体を基盤とした抗体医薬品や抗体検査薬の開発が報告されています。一方でタンパク質を応用利用するには、その機能を用途に応じて向上させる必要があります。特に生産性、安定性および活性の向上は、タンパク質の応用利用を実現するために必須であると考えられています。これまでタンパク質の高機能化を達成するためにタンパク質工学が利用されており、数多くの手法が開発・提唱されてきました。中でもコンピュータを利用したタンパク質デザイン法は、高速かつ比較的高い確率で高機能化タンパク質を取得できることから注目を集めており、世界的に研究開発が進められています。
研究の内容
本研究チームは、機能を向上させたい目的タンパク質 (鋳型構造、図1) とそのホモログ配列 (ライブラリ、図1) を入力データとし、「機能を向上させる有用変異点の同定」と、「遺伝的アルゴリズム3)を用いて多点の有用変異の組み合わせを最適化しつつ目的タンパク質に導入」するための新たなタンパク質デザイン法「GAOptimizer法」を開発しました。本法では図2に示したアルゴリズムを用いて、目的タンパク質をバーチャル進化させることが可能です。
第一に30個の親構造4)から、交叉 (こうさ) 組み換え変異 (親構造からランダムに2つ構造を選択し、赤色の四角で囲った領域を交叉させます。図2中ではp1およびp2と表記) あるいはランダム変異 (親構造から1つ構造を選んで点変異を導入) を導入して100個の子構造4)を発生させます。第二に発生させた子構造について、適応度関数を用いてスコアを算出します。なお適応度関数にはタンパク質構造の安定性を評価するロゼッタスコア (REU) 5)およびそれ以外の構造安定性に依存しないスコアを採用しました。算出したスコア値に基づき、最も適応度に優れた子構造をエリート構造6)として選択してn世代目の代表構造として保存します。第三にトーナメント選択 (発生させた100個の子構造からランダムに5個構造を選択し、その中で適応度に優れた子構造を親構造の候補として採用します。この過程を30回繰り返します) により子構造から次世代 (n+1世代) の親構造 (30個) を選抜し、1世代分の進化を完結します。上記の計算をN世代分繰り返して、バーチャル進化を完了します。
GAOptimizer法は2つ以上のパラメータを適応度関数として利用することで、選抜される有用変異の質を変えつつ、その組み合わせを最適化することができます。適応度関数依存的に多様な進化タンパク質を発生させることが可能です。本法の有用性を実験的に証明するため、構造・配列・機能が異なる3つのタンパク質に本法を適用して進化型タンパク質を複数個デザインし、その酵素学的諸性質 (耐熱性、活性およびタンパク質生産性) を検討しました。デザインしたタンパク質群の構造機能解析の結果、進化型タンパク質は鋳型となった天然型タンパク質と比べて、優れた機能を有することが判明しました。また適応度関数をREU以外のスコアに変更してバーチャル進化させたS-ヒドロキシニトリルリアーゼ (S-HNL、反応機能と立体構造は図3Aと3Bにそれぞれ表示) は、天然型HNLと比べて「生産性が10倍以上に向上」し、「触媒効率が3倍以上に上昇」、「耐熱性 (Tm) が5度程度向上」するなど、応用利用に適した機能を獲得することが確認されました (図3C)。以上の結果はGAOptimizer法が高機能化タンパク質をデザインする上で有効な手法となることを示しています。
図2. GAOptimizer法のアルゴリズムの詳細。上記の計算を繰り返して各世代 (n) のエリート構造を各世代の代表構造として選抜し、保存する。
今後の展開
GAOptimizer法では、適応度関数依存的に選抜される変異の種類により、世代数依存的に導入される変異の数が決定されます。つまり適応度関数と世代数を変更することで、目的タンパク質に異なる質と量を有する多点変異を、その組み合わせを最適化しつつ導入することが可能です。本法を用いることで、これまでの手法では難しかった産業応用のポテンシャルを秘めた天然由来タンパク質の高機能化デザインが達成され、タンパク質を用いた次世代生物素材の開発が加速することが期待されます。GAOptimizer法はZenodo上からダウンロードが可能です (https://zenodo.org/records/10208126)。
図3. S-HNLの反応スキーム (A) および立体構造 (B)。天然型HNLおよび進化型HNLの酵素機能比較 (C)。GAOptimizer法でデザインした進化型HNLは天然型HNLと比べて、生産性、触媒反応効率、耐熱性に優れることが判明した。
用語解説
注1)
ホモログ: 進化系統上の同一の祖先に由来する遺伝子の一群。
注2)
タンパク質工学: 自然界に存在するタンパク質・酵素アミノ酸配列を改変することで、産業応用的にあるいは基礎科学的に有用なタンパク質を開発するプロセス。上記のプロセスは「タンパク質再設計法」として近年は扱われており、コンピュータを使ってゼロからタンパク質をデザインする「デノボタンパク質設計」と区別される。GAOptimizer法は「タンパク質再設計法」に区分される。
注3)
遺伝的アルゴリズム: 進化の仕組みをコンピュータ内にて再現し、組み合わせ最適化問題を近似的に解くという進化的計算法の1つ。各世代において、親個体から交叉あるいは突然変異を経て複数の子個体が発生する。適応度の高い子個体を「解」として出力し、保存する。なお適応度は適応度関数という、ユーザーが規定した目的関数を利用して数値的に評価する。
注4)
親構造、子構造: 第0世代では鋳型構造にランダム変異を導入して計30個の親構造を発生させたのち、計算を実施している。親構造と子構造の数 (集団の数) を増やすことで初期収束を抑制することができる。本研究では計算時間の都合上、親構造を30個、子構造を100個として計算を実施した。プログラム内のパラメータを修正することで、集団の数を変更することが可能である。
注5)
ロゼッタスコア (Rosetta Energy Unit, REU): ワシントン大学の研究チームにより開発されたタンパク質・酵素デザインツールである「Rosetta (https://www.rosettacommons.org/software)」において、タンパク質分子の構造エネルギーを評価するために採用されているスコア。GAOptimizer法ではPyRosetta (https://www.pyrosetta.org) に実装されているスコア関数に、子構造の立体構造データを入力値として与えることで、本スコアの算出を行なっている。
注6)
エリート構造: GAOptimizer法ではユーザーが指定した適応度に最も優れた子構造のことを指している。
論文情報
(雑誌) Cell Reports Physical Science
(題目) Development of Evolutionary Algorithm-Based Protein Redesign Method
(著者) Hiroki Ozawa, Ibuki Unno, Ryohei Sekine, Taichi Chisuga, Sohei Ito and Shogo Nakano*
(DOI) 10.1016/j.xcrp.2023.101758
(URL) https://doi.org/10.1016/j.xcrp.2023.101758
研究助成
この研究は、JSTさきがけ (課題番号JPMJPR20AB) および日本学術振興会 (JSPS) の若手研究 (課題番号18K14391)、 基盤研究C (課題番号21K05395, 23K04510) の支援により実施されました。
お問い合わせ先
<研究に関すること>
中野 祥吾 (ナカノ ショウゴ)
静岡県立大学 食品栄養科学部 准教授
<JSTの事業に関すること>
安藤 裕輔 (アンドウ ユウスケ)
科学技術振興機構 戦略研究推進部 グリーンイノベーショングループ
<報道担当>
科学技術振興機構 広報課