微生物叢中のゲノム配列を長く正確に決定する新手法~未知の種や変異株のゲノム配列決定を促進~

ad

2021-11-01 東京工業大学,日本医療研究開発機構

要点
  • 微生物叢中のゲノム配列決定用ソフトウェア「MetaPlatanus」を開発
  • 実データのテストで、全長に近い微生物ゲノム配列を多く決定することに成功
  • 従来手法より効率的に未知の種や変異株のゲノム情報を収集できる可能性
概要

東京工業大学生命理工学院生命理工学系の梶谷嶺助教と吉村大大学院生(研究当時)、伊藤武彦教授の研究グループは、国立遺伝学研究所の野口英樹特任教授と豊田敦特任教授、九州大学の後藤恭宏助教と林哲也教授、久留米大学の奥野未来助教と小椋義俊教授、香川大学の桑原知巳教授と共同で、微生物叢(用語1)中のゲノムの新規配列決定(用語2)を行う情報解析手法を開発した。

本研究で開発されたソフトウェアである「MetaPlatanus(メタプラタナス)」はDNAシークエンサー(用語3)の読み取り結果を受け取り、既知の参照配列に頼ることなく元の微生物ゲノム配列を決定する。この工程では、異なるタイプのDNAシークエンサーのデータを同時に活用し、微生物種ごとの配列の特徴を検出して誤った配列接続を防ぎつつ新規配列決定を行う。

実データを用いたテストでは、MetaPlatanusは従来手法と比較して、全長に近い微生物のゲノム配列を多く決定することに成功していた。本ソフトウェアの活用により、未知の種や変異株のゲノム配列決定が促進されると期待される。

本研究成果は英科学誌「Nucleic Acids Research(ニュークレイク・アシッド・リサーチ:核酸研究)」にて2021年9月27日に公開された。

背景

微生物叢に含まれるメタゲノム(用語4)の新規配列決定を行うことで、多くの生物学的に重要な知見が得られている。例としては、世界中のヒト腸内に多量に存在するウイルス(crAssphage­=クラスファージなど、用語5)、培養例が無い細菌の巨大系統群(CPR群)、真核生物の起原の鍵を握るアスガルド古細菌(用語6)の発見などがある。

また、既知の配列と違いが大きい変異株ゲノムを調べる際にも新規配列決定は有効である。メタゲノム解析の発展はDNAシークエンサーの技術革新に後押しされており、様々な機種が登場しているが、一度に読み取れる配列の長さや正確性について、それぞれに長所と短所が存在する。既存の新規配列決定用ソフトウェアについても、時おり異なる生物種のゲノム配列を誤ってつなげてしまう、長い配列を決定することができないといった問題が生じていた。

研究内容と成果

本研究グループは、微生物叢中のゲノム配列を長く正確に決定する情報解析手法を新規開発した(図1)。開発したソフトウェアであるMetaPlatanusはDNAシークエンサーの読み取り結果を受け取り、既知の参照配列に頼ることなく元の微生物ゲノム配列を決定する。本手法では、ショートリード(用語7)とロングリード(用語8)のDNAシークエンサーのデータを同時に活用している。

微生物叢中のゲノム配列を長く正確に決定する新手法~未知の種や変異株のゲノム配列決定を促進~
図1.開発手法(MetaPlatanus)の模式図

新規機能の例としては、微生物種ごとの配列の特徴(読み取り配列量、部分文字列の出現頻度情報など)を検出して誤った配列接続を防ぐことが挙げられる。それに伴い、計算途中で用いるデータ構造が単純になり、読み取りDNA配列量が少ない微生物についても積極的に配列をつないでいくことも可能となる。

ヒトの腸内および口腔内の実データを用いたテストでは、MetaPlatanusは従来手法と比較して、全長に近い真正細菌(用語9)のゲノム配列、ウイルスの配列、タンパク質コード遺伝子(用語10)を多く決定することに成功した。さらに、存在量が多くその後の解析でも重要な細菌のゲノム配列が、従来手法では極めて断片的にしか決定されないケースも発見されていたが、本手法ではほぼ全長の配列が得られていた(図2)。


図2.MetaPlatanusでのみ全長近くのゲノム配列が決定できた例ヒトの口腔内サンプルに対する結果。対応する生物種はレンサ球菌であるStrptococcus salivarius(用語11)で、今回のサンプル内で多量に存在していると推定される。配列決定の結果が分断されている場合、対応する図中の線も途切れる。近縁株の参照配列は、大まかな配列の正確性を見積もるために表示。

今後の展開

開発された手法は他の動物の腸内や体表面、土壌、海水など様々な微生物叢の研究に応用可能である。単離培養(用語12)に成功した微生物種は全体のごく一部と言われており、メタゲノムの新規配列決定は引き続き新種ゲノムの収集に有効と考えられる。現状のメタゲノム研究では、多くがゲノムの一部分である遺伝子領域を単位として進められているが、本手法を用いて全長に近いゲノム配列を得られれば、各生物種(株)の進化の軌跡、代謝経路の全体的な構造などを考察する上で有用である。また、多様性の高い病原菌の変異情報を集める手段として有効である可能性もある。なお、本手法でもゲノムの全長を決定できないケースは多くあり、完璧な方法とは言えない。論文発表により多くのサンプルへの適用とデータ蓄積が進み、開発が継続的に進むことが期待される。

用語説明
(用語1)微生物叢(びせいぶつそう)
多数の微生物を含んだ環境。微生物群集、マイクロバイオームとも呼ばれる。
(用語2)ゲノムの新規配列決定
ここでは、短いDNAシークエンサーの読み取り配列をコンピューター上でつなぎ合わせ、元の長いゲノム配列を決定することを指す。de novoアセンブリとも呼ばれる。
(用語3)DNAシークエンサー
DNA配列を読み取る機器。一度にゲノムDNAの全長配列を決定することはできない。
(用語4)メタゲノム
微生物叢に含まれる生物のゲノム情報の総体。
(用語5)crAssphage­(クラスファージ)
メタゲノム解析により初めて存在が確認されたウイルス。多くの人々が腸内に保有していると報告されている。
(用語6)アスガルド古細菌
古細菌(アーキア)と呼ばれる系統に属する微生物。動物や植物を含む生物の系統(真核生物)と共通する性質を持つことが注目されている。
(用語7)ショートリード
安価に大量のDNAを読み取ることができ、結果配列の正確性も高いが、一度に読み取れる配列は短い(数百塩基対)タイプのDNA配列読み取りの方式。
(用語8)ロングリード
ショートリードと比較して、一度に飛躍的に長い(数千~数万塩基対)配列を読み取れるタイプのDNA配列読み取りの方式。ただし、読み取り結果の正確性やコストではショートリード方式に劣る。
(用語9)真正細菌
微生物の系統の1つ。大腸菌など、~菌と一般に呼ばれるものの多くは真正細菌である。バクテリアとも呼ばれる。
(用語10)タンパク質コード遺伝子
タンパク質を作る元になるゲノムDNAの一部。タンパク質は生体内で様々な機能を担う。
(用語11)Strptococcus salivarius(ストレプトコッカス サリバリウス)
レンサ球菌と呼ばれる真正細菌の1種。ヒトの口腔内に多く存在する。
(用語12)単離培養
微生物を元の生息環境から分けて、人工的な環境(培地など)で育てること。
付記

本研究は、国立研究開発法人日本医療研究開発機構(AMED)の革新的先端研究開発支援事業(PRIME)「微生物叢と宿主の相互作用・共生の理解と、それに基づく疾患発症のメカニズム解明」領域における研究開発課題「高完成度ドラフトゲノム構築による種内変異レベル解像度のメタゲノミクス」(研究開発代表者:梶谷嶺、課題番号:JP16gm6010003)、日本学術振興会(JSPS)科学研究費助成事業(課題番号:JP16H06279(PAGS)、JP15H05979、JP18K19286、JP19H03206、JP20K15769、JP21K19211)の支援を受けて行われた。

論文情報
掲載誌
Nucleic Acids Research
論文タイトル
MetaPlatanus: a metagenome assembler that combines long-range sequence links and species-specific features
著者
Rei Kajitani, Hideki Noguchi, Yasuhiro Gotoh, Yoshitoshi Ogura, Dai Yoshimura, Miki Okuno, Atsushi Toyoda, Tomomi Kuwahara, Tetsuya Hayashi and Takehiko Itoh
DOI
10.1093/nar/gkab831
お問い合わせ先

東京工業大学 生命理工学院 生命理工学系 教授
伊藤武彦

取材申し込み先
東京工業大学 総務部 広報課

AMED事業に関すること
日本医療研究開発機構(AMED)
シーズ開発・研究基盤事業部 革新的先端研究開発課

細胞遺伝子工学
ad
ad
Follow
ad
タイトルとURLをコピーしました