ゲノム構造変異とリピート変異を配列識別して高精度に検出するソフトウェアTRsvを開発

ad

2025-08-25 国立遺伝学研究所

情報・システム研究機構国立遺伝学研究所らの研究チームは、ゲノムの繰り返し変異(TR変異)、構造変異(SV)、短い挿入欠失(indel)を同時に高精度で検出できる新ソフトウェア「TRsv」を開発した。従来はTR変異とSV/indelを正確に区別して解析する手法がなく、疾患研究の精度向上が課題となっていた。TRsvはロングリード配列データを用いて、異なるタイプの挿入(TR繰り返し挿入、非TR繰り返し挿入、非繰り返し挿入)を識別可能で、既存ツールを上回る精度と感度を実現した。160人分の全ゲノムデータ解析では、TR変異が遺伝子発現量や疾患、量的形質と強く関連することを明らかにし、神経筋疾患や発達障害、がんなどに関わる分子基盤の理解に貢献する成果となった。本研究はJSPS科研費の支援を受け、『Genome Biology』に掲載。今後ロングリード技術の普及に伴い、TRsvはゲノム医科学や精密医療に広く応用されることが期待される。

ゲノム構造変異とリピート変異を配列識別して高精度に検出するソフトウェアTRsvを開発
図1: TRsvはタンデム繰り返し領域で観察される異なるタイプの挿入を検出する
タンデム繰り返し(TR)領域内では、TR領域の繰り返し単位(図の例ではGCC)と同じ繰り返し単位からなるTR繰り返し挿入が観察されることが多いが、異なる繰り返し単位からなる挿入(Non-TR繰り返し挿入)や、繰り返しを持たない挿入(非繰り返し挿入)がしばしば観察される。TRsvは、これらの異なるタイプの挿入を区別して同定する。

<関連情報>

TRsv:ロングリードシーケンスデータを用いたタンデムリピート変異、構造変異、および短いインデルの同時検出 TRsv: simultaneous detection of tandem repeat variations, structural variations, and short indels using long read sequencing data

Shunichi Kosugi & Chikashi Terao
Genome Biology  Published:20 August 2025
DOI:https://doi.org/10.1186/s13059-025-03718-z

Abstract

Tandem repeat copy number variations (TR-CNVs), structural variations (SVs), and short indels have been responsible for many diseases and traits, but no tools exist to distinguish and detect these variants. In this study, we developed a computational tool, TRsv, to distinguish and detect TR-CNVs, SVs, and short indels using long reads. In evaluation with simulated and real datasets, TRsv outperformed existing tools for detection of TR-CNVs and indels and performed equally well for detection of SVs. We demonstrated genome-wide detection of TR-CNVs, including variants associated with gene expression, disease, and quantitative traits, using 160 long-read whole genome sequencing data and TRsv.

細胞遺伝子工学
ad
ad
Follow
ad
タイトルとURLをコピーしました