2022-09-27 東京大学
発表者
王 健康(東京大学大学院医学系研究科 分子細胞生物学専攻 細胞生物学・解剖学講座 医学博士課程4年)
中戸 隆一郎(東京大学定量生命科学研究所附属高度細胞多様性研究センター大規模生命情報解析研究分野 准教授)
発表のポイント
- 遺伝子発現やゲノム立体構造形成に重要な機能を持つコヒーシン複合体に関連する既存データを網羅的に収集したデータベース “CohesinDB” を開発しました。
- CohesinDBには、ヒトの176細胞種から成る転写因子結合、遺伝子発現変動、ゲノム立体構造など計2,043サンプルが含まれており、Webブラウザシステムを通じて可視化、解析、データダウンロードなどが誰でも簡単に行うことができます。
- CohesinDBはコヒーシン関連解析だけでなく、転写制御や疾患関連解析などに関する全ての研究者にとって有用なリソースとなります。
発表概要
コヒーシンはゲノムの立体構造制御や遺伝子発現制御に重要な役割を果たすタンパク質複合体です。コヒーシンの変異は急性骨髄性白血病や複数の先天性疾患の要因となることから、これらの疾患の発症メカニズムを解明するうえで、コヒーシンの果たす機能を明らかにすることが求められています。しかしながら、コヒーシンの機能はエピゲノム・転写制御・ゲノム立体構造制御など多岐にわたるため、網羅的な全ゲノム解析は難易度が高く、これまで困難でした。
東京大学大学院医学系研究科の王健康大学院生、定量生命科学研究所附属高度細胞多様性研究センター 大規模生命情報解析研究分野の中戸隆一郎准教授は、そのような統合的大規模解析の解析コストを低減するため、コヒーシンに関するゲノム解析データを格納した大規模データベース”CohesinDB” (https://cohesindb.iqb.u-tokyo.ac.jp/) を開発しました。本データベースでは、過去に論文として報告されデータが公開されている全ゲノムデータを網羅的に収集し、独自のパイプラインを用いて統一的に再解析のうえ、得られたコヒーシンに関連するエピゲノム領域(プロモーター・エンハンサーなど)、遺伝子、クロマチンループなどを統一的にラベル付けし、データベースとして公開しています。本データベースはWebブラウザシステムを通じて可視化、解析、データダウンロードなどが誰でも簡単に行うことができます。これにより、情報学の非専門家にとってこれまで難しかった大規模ゲノム解析が容易になり、コヒーシン研究の一層の推進が期待されます。
本研究は、AMED-PRIME「頑健なデータ駆動形エピゲノム解析を実現する情報解析システムの構築」(代表:中戸隆一郎、JP22gm6310012h0003)、からの支援を受けて実施されました。
本研究は、2022年9月27日付でNucleic Acids Research誌に掲載されました。