PZLAST-MAG:膨大なMAG由来タンパク質の配列を高速検索する新しいウェブサーバーを公開

ad

2026-05-12 国立遺伝学研究所

情報・システム研究機構 国立遺伝学研究所の森宙史准教授らの研究グループは、メタゲノム由来ゲノム(MAG)から得られた膨大なタンパク質配列を高速検索できるウェブサーバー「PZLAST-MAG」を開発・公開した。成果は2026年にBioinformatics Advancesへ掲載された。MAGは培養が難しい環境微生物のゲノム情報として注目されており、本システムはMicrobiome Datahubに収録された21万件超のMAG由来約4億配列(約1,000億アミノ酸)を対象に検索できる。PEZY-SC3メニーコアプロセッサ上へ実装することで、DIAMONDやMMseqs2並みの精度を保ちながら、5〜15分で大規模類似検索を実行可能にした。さらに、検索結果について微生物系統分布、生息環境(MEO環境オントロジー)、複数遺伝子の共起パターンを可視化できる点が特徴で、遺伝子機能と生態学的背景を同時に解析できる。環境微生物研究、バイオ資源探索、機能遺伝子解析など幅広い分野への活用が期待される。

PZLAST-MAG:膨大なMAG由来タンパク質の配列を高速検索する新しいウェブサーバーを公開
PZLAST-MAG webサーバーの概要。A: 検索画面。B: 表形式の結果表示。C: 系統分岐図上での結果表示。D: ヒットしたMAGの環境分布。E: 複数クエリ配列の場合のMAGごとの共起関係の表示。

<関連情報>

PZLAST-MAG:大規模MAGタンパク質の全長タンパク質配列類似性検索サーバー PZLAST-MAG: full length protein sequence similarity search server of large-scale MAG proteins

Koichi Higashi,Hitoshi Ishikawa,Ken Kurokawa,Hiroshi Mori
Bioinformatics Advances  Published:06 May 2026
DOI:https://doi.org/10.1093/bioadv/vbag129

Abstract

Motivation

Metagenome-assembled genomes (MAGs) provide access to novel protein sequences from uncultured microbes, offering invaluable resources for studying protein diversity, structure prediction, and evolutionary analysis. However, despite the explosive growth of MAG-derived protein data, tools enabling fast and accurate similarity searches against large-scale MAG protein datasets remain limited.

Results

We present PZLAST-MAG, a web server for ultra-fast sequence similarity searches against 0.4 billion MAG-derived protein sequences (0.1 trillion amino acids) from over 210,000 MAGs indexed in Microbiome Datahub. Implemented on PEZY-SC3 MIMD many-core processors, PZLAST-MAG achieves high accuracy and speed, with performance comparable to widely used tools such as DIAMOND and MMseqs2 based on our benchmark analyses. In addition to tabular alignments, PZLAST-MAG provides interactive visualizations of phylogenetic and environmental distributions and co-occurrence patterns of homologous proteins across MAGs. This combination enables rapid homolog mining of functionally important genes across diverse microbial lineages while simultaneously revealing their taxonomic and ecological contexts. Two use case analyses indicate its utility for homolog mining of metabolic enzyme genes and plasmid-derived genes.

Availability and implementation

PZLAST-MAG is provided as a web-based service and is freely available at https://pzlast.nig.ac.jp/pzlast/mag without requiring registration.

細胞遺伝子工学
ad
ad
Follow
ad
タイトルとURLをコピーしました