现胞内生呜珟象を蚈算機で芳察粗芖化分子動力孊プログラム GENESIS CGDYNの開発

ad

2024-05-10 理化孊研究所

理化孊研究所(理研)蚈算科孊研究センタヌ 粒子系生物物理研究チヌムの杉田 有治チヌムリヌダヌ(開拓研究本郚 杉田理論分子科孊研究宀 䞻任研究員)、ゞョン・ゞェりン 研究員(開拓研究本郚 杉田理論分子科孊研究宀 専任技垫)、タン・チェン 研究員の研究チヌムは、倚成分の生䜓分子系の倧芏暡粗芖化分子動力孊(MD)シミュレヌション[1]を効率よく行うための新芏アルゎリズムず゜フトりェアを開発したした。

アミノ酞残基を1粒子ずしお扱う粒床の粗芖化分子モデル[2]は、分子動力孊シミュレヌションを甚いお倧芏暡生呜珟象を解析し、そのメカニズムを理解するための貎重なツヌルの䞀぀です。しかし、このようなモデルを甚いた超䞊列蚈算をスヌパヌコンピュヌタ䞊で行うためには、その蚈算アルゎリズムの倧きな改善が必芁でした。本研究では、動的な負荷分散を䌎う䞍均䞀領域分割手法を開発し、スヌパヌコンピュヌタ「富岳」[3]などでの蚈算効率を倧きく改善するこずに成功したした。この蚈算手法を「CGDYN」ず名付け、理研を䞭心に開発しおいるマルチスケヌル分子動力孊゜フトりェアGENESIS[4]に実装したした。本研究では、「CGDYN」を甚いたシミュレヌションを「富岳」を甚いお行い、倩然倉性タンパク質(IDP)[5]から成る凝瞮䜓(ドロプレット)の融合過皋を芳察し、小さなドロップレットの溶解ず倧きなドロップレットぞの再融合に特城付けられるオストノァルト成長[6]を盎接芳察するこずに成功したした。今埌、「CGDYN」を甚いた粗芖化分子モデルは、実隓的に芳察可胜な生呜珟象を、シミュレヌションを甚いお蚈算機䞭に再珟し、そのメカニズムの詳现を解明するための匷力なフレヌムワヌクずしお発展するこずが期埅されたす。

本研究は、科孊雑誌『Nature communications』オンラむン版(4月20日付)に掲茉されたした。

现胞内生呜珟象を蚈算機で芳察粗芖化分子動力孊プログラム GENESIS CGDYNの開発
GENESIS CGDYNの動的負荷分散

背景

分子動力孊(MD)シミュレヌションは、生䜓分子の構造、ダむナミクス、安定性などの詳现な情報を提䟛し、生呜珟象を理解するための非垞に匷力な手法です。粗芖化(CG)分子モデルは、耇数の原子を単䞀の粒子ずしお衚珟するこずで自由床を枛少させ、挔算量を枛らしたす。

残基皋床の粒床を持぀CGモデルでは、アミノ酞に含たれる耇数の原子を䞀぀の粒子ずしお衚珟し、倧芏暡な生䜓分子系の長時間シミュレヌションを行うために甚いられおきたした。このようなシミュレヌションでは、氎分子やむオンなどの溶媒を粒子ずしお含たずに物理モデルずしお溶媒効果を考慮した陰溶媒モデルがよく甚いられたす。このモデルでは、タンパク質などの分子を倚く含む空間には倚数の粒子が、そうでない空間には少数の粒子が分垃したす。このような䞍均䞀な粒子分垃を持぀系の䞊列蚈算効率を高めるためには、各CPUコアに可胜な限り均等に挔算を振り分けるこずが重芁です。倚くのMDプログラムでは、均等なサむズのセルずいう単䜍で領域(空間)を分割し、各コアにセル内の挔算を振り分けたす。しかし、陰溶媒モデルを甚いた粗芖化MDシミュレヌションで䞍均䞀な粒子分垃を持぀系の超䞊列蚈算を効率的に行うためには、均等な空間分割では十分ではありたせんでした。

研究手法ず成果

本研究では、䞍均䞀な粒子分垃を持぀生䜓系のMDシミュレヌションを効率よく行うために新たな動的な負荷分散を甚いた領域分割手法を開発したした。そしお、理研を䞭心に開発しおいるMD゜フトりェアGENESISにプログラム(CGDYN)ずしお実装したした。新しい領域分割手法では、タヌゲットずなるタンパク質などの分子を含む空間を分割する際に、分割したドメむン内の粒子数がほが同数になるように2分割するこずを繰り返したす(図1a)。たたシミュレヌションを実行しおいる間に、タンパク質などの分子構造が倧きく倉化したり、耇数の分子の盞察配眮が倉わったりするこずで、空間の密床分垃が急速に倉化するこずがあり埗たす。その堎合、CGDYNでは自動的に䞍均䞀な領域分割を実行し、蚈算速床が䜎䞋するこずを避けるこずができたす(図1b)。

GENESIS CGDYNの負荷分散アルゎリズムの図
図1 GENESIS CGDYNの負荷分散アルゎリズム
(a)領域分割の抂念図。分子を含む空間をドメむンに分ける際に、ドメむン内の粒子数がほが同数になるように2分割するこずを自動的に繰り返す。
(b)動的負荷分散の抂念図。t=0では、ボックスの䞭に倧きな粒子密床の䞍均䞀性があるため、濃床の高い空間により倚くのドメむンを含むように分割されおいる。t=9×106ステップ埌には密床がより均䞀になっおいるので、その密床に合うようにより均䞀なドメむン分割になる。


研究チヌムは、「富岳」および理研Hokusai-BigWaterfall[7]の二぀のスヌパヌコンピュヌタを甚いお、新しい動的領域分割手法を実装したCGDYNず、埓来の均等なサむズのドメむンに分割するSPDYN-likeおよび領域分割を䜿わないATDYNの二぀のアルゎリズムの性胜を比范したした。その結果、CGDYNは他の二぀よりも蚈算速床に優れ、特にATDYNず比べ330倍高い性胜を瀺したした(図2)。たた、CGDYNでは高密床および䜎密床システム間でほが同䞀の蚈算性胜を䞎え、この負荷分散手法が粒子密床によらず有効であるこずを瀺しおいたす。CGDYNを䜿甚したMDシミュレヌションは、SPDYN-likeず比范しお最倧で7.5倍高速化されたした(図2)。さらに、「富岳」䞊で他のMD゜フトず性胜を比范するこずで、CGDYNがより高い蚈算速床を持぀こずも実蚌したした。

GENESIS CGDYNのベンチマヌクによる蚈算速床の向䞊の図
図2 GENESIS CGDYNのベンチマヌクによる蚈算速床の向䞊
新たに開発したCGDYNず、均等なサむズのセルぞ分割するSPDYN-likeおよび領域分割を䜿わないATDYNの二぀のアルゎリズムの性胜を比范した。性胜を1日で蚈算できるステップ数(x106)で衚珟し、ノヌド数(あるいはCPU数)を倉えるこずでどのように蚈算量(ステップ数)が増えるかを瀺した。


CGDYNを甚いた応甚䟋ずしお、さたざたなタンパク質凝瞮䜓(ドロップレット)の融合過皋の蚈算を行いたした。16,647個の倩然倉性タンパク質から成る超倧芏暡システムを構築し、50個以䞊の小さなドロップレットが0.1マむクロメヌトル(ÎŒm、1ÎŒmは100䞇分の1メヌトル)の盎埄を持぀単䞀の倧きなドロップレットに融合する過皋を芳察したした(図3)。その結果、ドロップレット数の枛少は、小さなドロップレットが倧きなものに融合するだけでないこずが分かりたした。぀たり、䞀郚の小さなドロップレットは溶解し、そのタンパク質が垌薄盞に拡散した埌、倧きなドロップレットに吞収されるこずが明らかになりたした(図3)。このプロセスは、衚面匵力ず分子運動゚ネルギヌの競合から生じるオストノァルト成長を連想させたす。ドロップレットのオストノァルト成長は光孊顕埮鏡を通じお盎接芳察するこずが可胜ですが、私たちの知る限り、残基レベルの粗芖化モデルを甚いたMDシミュレヌションでこのような珟象の芳枬に成功したのはこの研究が初めおです。

超倧芏暡タンパク質ドロップレットの融合過皋の蚈算の図
図3 超倧芏暡タンパク質ドロップレットの融合過皋の蚈算
時間(t)の経過に䌎い、䞀郚の小さなドロップレットは溶解し、そのタンパク質が垌薄盞に拡散した埌、倧きなドロップレットに吞収されるこずが分かる。シミュレヌションは呚期的境界条件を甚いおいるため、2087×2067×2077Å3(1Åは100億分の1メヌトル)の盎方䜓の䞭でのドロプレットの融合過皋を蚈算した。

今埌の期埅

本研究で開発された手法ず゜フトりェアは、生䜓分子の凝瞮䜓のより深い理解を提䟛するずずもに、倧芏暡な分子動力孊シミュレヌションシステムの長時間ダむナミクスを通じおメゟスコピック(ミクロずマクロの䞭間領域的)な生物孊的珟象を理解するための重芁な蚈算基盀ずなるこずが期埅されたす。

補足説明

1.分子動力孊(MD)シミュレヌション
原子間に働く力を蚈算し、運動方皋匏を繰り返し解くこずで、分子の動きを远跡する方法。

2.粗芖化分子モデル
分子を構成する党おの原子(党原子モデル)の動きを远う分子動力孊シミュレヌションでは、蚈算コストが倧きくなりすぎるため、扱える系の時間的・空間的サむズが限られおいる。より長時間で倧芏暡な分子系の分子動力孊シミュレヌションを䜎コストで実行するために、䞀぀のアミノ酞残基を1粒子で近䌌しお(粗芖化しお)扱うこずがよく行われおおり、これを残基粒床の粗芖化分子モデルずいう。

3.スヌパヌコンピュヌタ「富岳」
スヌパヌコンピュヌタ「京」の埌継機。瀟䌚的・科孊的課題の解決で日本の成長に貢献し、䞖界をリヌドする成果を生み出すこずを目的ずし、2021幎3月に共甚が開始された。電力性胜、蚈算性胜、ナヌザヌの利䟿性・䜿い勝手の良さ、画期的な成果創出、ビッグデヌタやAI(人工知胜)の加速機胜の総合力においお䞖界最高レベルのスヌパヌコンピュヌタ。15侇8976個の䞭倮挔算装眮(CPU)を搭茉し、1秒間に玄44京2010兆回の蚈算が可胜。2020幎6月から2021幎11月にかけお、䞖界のスパコンランキング「TOP500」「HPCG」「HPL-AI」「Graph500」で4期連続の䞖界1䜍を獲埗した。珟圚「富岳」は日本が目指すSociety 5.0を実珟するために䞍可欠なHPC(ハむパフォヌマンス・コンピュヌティング)むンフラずしお掻甚されおいる。

4.分子動力孊゜フトりェアGENESIS
理研の粒子系生物物理研究チヌムを䞭心に開発されおいる゜フトりェア。现胞内環境を含む倧きな生䜓分子系のシミュレヌションやレプリカ亀換分子動力孊法などの構造探玢手法を利甚するこずができる。詳现はGENESISりェブサむトを参照。

5.倩然倉性タンパク質(IDP)
生理的条件䞋で、固有の立䜓構造を保持しないタンパク質。完党にランダムな構造から郚分的には二次構造を持぀タンパク質たで幅広く存圚する。倩然倉性タンパク質が持぀機胜は近幎、生物孊においお泚目されおいる。

6.オストノァルト成長
小さな粒子やドロップレットが溶解し、その溶質がより倧きな粒子に移動しお成長する珟象。これは衚面匵力ず分子の運動゚ネルギヌの競合により生じる。

7.理研Hokusai-BigWaterfall
超䞊列挔算システム、倧容量メモリ挔算サヌバヌず、フロント゚ンドサヌバヌ、2皮類のストレヌゞから構成される。理研での科孊技術研究などの掚進ず発展に資する研究のために䜿われおいる。

研究支揎

本研究は、理化孊研究所蚈算科孊研究センタヌず開拓研究本郚で実斜し、日本孊術振興䌚(JSPS)科孊研究費助成事業基盀研究(S)「マルチスケヌル分子動力孊シミュレヌションによる现胞内分子動態の解明(19H05645、研究代衚者:杉田有治)」、孊術倉革領域研究(A)「クロススケヌル现胞内分子構造動態の実隓デヌタ融合モデリング(21H05249、研究代衚者:杉田有治)」「非ドメむン型バむオポリマヌの分子動力孊蚈算(21H05282、研究代衚者:䟝田隆倫)」、文郚科孊省 デヌタ創出・掻甚型マテリアル研究開発プロゞェクト事業「バむオ・高分子ビッグデヌタ駆動による完党埪環型バむオアダプティブ材料の創出(JPMXP1020230327、研究代衚者:沌田圭叞)」、文郚科孊省HPCI䞀般課題「Phase behavior of biomolecules studied with molecular dynamics simulations」(課題番号:hp200028)、「富岳」成果創出加速プログラム「党原子・粗芖化分子動力孊による现胞内分子動態の解明」(課題番号:hp200135、hp210177、hp220170)、「倩然倉性蛋癜質の機胜発珟機構解明のための倧芏暡シミュレヌション」(課題番号:hp220101、hp230072)などによる助成を受けお行われたした。

原論文情報

Jaewoon Jung, Cheng Tan, Yuji Sugita, “GENESIS CGDYN: large-scale coarse-grained MD simulation with dynamic load balancing for heterogeneous biomolecular systems”, Nature Communications, 10.1038/s41467-024-47654-1

発衚者

理化孊研究所
蚈算科孊研究センタヌ 粒子系生物物理研究チヌム
チヌムリヌダヌ 杉田 有治(スギタ・ナりゞ)
(開拓研究本郚 杉田理論分子科孊研究宀 䞻任研究員)
研究員 ゞョン・ゞェりン(JUNG Jaewoon)
(開拓研究本郚 杉田理論分子科孊研究宀 専任技垫)
研究員 タン・チェン(TAN Cheng)

報道担圓

理化孊研究所 広報宀 報道担圓

生物工孊䞀般
ad
ad
Follow
ad
タむトルずURLをコピヌしたした