限られたゲノムデータからバクテリアの代謝可能性を予測する(Predicting Metabolic Potential in Bacteria From Limited Genome Data)

ad

2024-07-24 パシフィック・ノースウェスト国立研究所(PNNL)

バクテリアが食物を摂取し、その食物からどのような生成物を作り出すかは、ゲノムにコードされた酵素パターンの代謝ネットワークによって決まります。このパターンを多数の既知のバクテリアから学習することで、新しいバクテリアのゲノムを分析し、その代謝能力を明らかにできます。特に環境サンプルのように不完全な情報しかない場合にも有用です。この新しい方法は、環境やバイオエネルギー分野で重要なバクテリアの新たな代謝能力を発見することができます。これは、作物の収量改善のための植物成長を支える微生物群の理解に重要です。また、異なる代謝ネットワークの理解が進むことで、バクテリアをバイオエネルギーや医療分野で新たに利用する方法の開発にもつながります。このプロジェクトは、David Geller-McGrathの大学院論文プロジェクトとして始まり、彼が太平洋北西国立研究所とアリゾナ大学での研究を通じて方法を洗練させ、コードを開発しました。

<関連情報>

MetaPathPredictで不完全な細菌ゲノムの代謝モジュールを予測する Predicting metabolic modules in incomplete bacterial genomes with MetaPathPredict

David Geller-McGrath,Kishori M Konwar,Virginia P Edgcomb,Maria Pachiadaki,Jack W Roddy,Travis J Wheeler,Jason E McDermott
eLife  Published:May 2, 2024
DOI:https://doi.org/10.7554/eLife.85749

限られたゲノムデータからバクテリアの代謝可能性を予測する(Predicting Metabolic Potential in Bacteria From Limited Genome Data)

Abstract

The reconstruction of complete microbial metabolic pathways using ‘omics data from environmental samples remains challenging. Computational pipelines for pathway reconstruction that utilize machine learning methods to predict the presence or absence of KEGG modules in incomplete genomes are lacking. Here, we present MetaPathPredict, a software tool that incorporates machine learning models to predict the presence of complete KEGG modules within bacterial genomic datasets. Using gene annotation data and information from the KEGG module database, MetaPathPredict employs deep learning models to predict the presence of KEGG modules in a genome. MetaPathPredict can be used as a command line tool or as a Python module, and both options are designed to be run locally or on a compute cluster. Benchmarks show that MetaPathPredict makes robust predictions of KEGG module presence within highly incomplete genomes.

生物工学一般
ad
ad
Follow
ad
タイトルとURLをコピーしました