2022-03-22 理化学研究所
理化学研究所(理研)生命医科学研究センター統合細胞システム研究チームの柚木克之チームリーダーらの共同研究グループは、細胞内の遺伝子回路(転写制御ネットワーク)[1]を公開情報に基づいて比較解析する手法を開発し、統合失調症[2]患者由来の神経系細胞において高頻度に出現する脂質代謝制御遺伝子回路を再構築することに成功しました。
本研究成果は、統合失調症の分子基盤を実験的に検証する際の新たな判断材料を提供するほか、データ駆動型生命医科学の確立に向けた予測・仮説生成手法の発展に貢献すると期待できます。
今回、共同研究グループは、統合失調症患者由来の神経系細胞から得られた既報のトランスクリプトーム[3]データセット15件および関連する公開情報に基づいて、脳機能に関与することが近年指摘されている脂質代謝を制御する遺伝子回路を再構築し、メタ解析[4]を行いました。その結果、先行研究では見逃されていた遺伝子回路の存在が浮かび上がりました。また、複数の統合失調症患者集団に共通する遺伝子回路を見いだしたほか、統合失調症と関連する可能性のある形質・疾患を予測しました。
本研究は、科学雑誌『Neuroscience Research』(2022年2月号)、オンライン版(2021年12月31日付)に掲載されました。
背景
精神疾患の罹患者数は近年増加を続けており、2013年度に厚生労働省は、がん、脳卒中、急性心筋梗塞、糖尿病の4大疾患に精神疾患を加え「5大疾患」と定義しました。精神疾患の一つである統合失調症は、神経機能障害、炎症反応、脂質代謝異常などさまざまな症状を呈することが知られています。
統合失調症の発症には遺伝的要因の関与が指摘されており、これまでに100個以上の一塩基変異(SNP)[5]との関連が報告されています。これらのSNPはヒトゲノム上のさまざまな場所に存在し、多数の遺伝子の発現と関連していることから、統合失調症は多因子疾患であると考えられます。また、これら統合失調症関連SNPのうちエンハンサー[6]上に存在するものにおいては、特に脳で活性化するエンハンサー上のSNPが多いことが知られています。従って、統合失調症に関わる遺伝子発現制御異常のメカニズムを解明するためには、多数の遺伝子の転写制御についてエンハンサーを考慮に入れて検討することが重要だと考えられます。
これまで、統合失調症に関連する遺伝子群の遺伝子回路については多くの報告がなされてきましたが、先行研究には以下のような問題点がありました。
1.特定の転写因子[7]だけに着目しており、遺伝子発現調節の全体像を見ていない。
2.単一のデータセットに基づいており、統合失調症の多様な病因や共通の特徴を議論するには不十分である。
3.プロモーター[8]を介した転写制御に重きを置いており、エンハンサーを考慮していない。
そこで、共同研究グループは統合失調症患者由来の神経系細胞から得られた15件の既報トランスクリプトームデータセットそれぞれについて遺伝子回路を再構築し、メタ解析を行いました。当該ネットワークを再構築するにあたっては、プロモーターだけでなくエンハンサー依存的な転写制御も同時に考慮しました。
研究手法と成果
共同研究グループは「公開情報に基づくインテリジェンス(OSINT)[9]」の考え方にヒントを得て、公開されているゲノムデータおよびトランスクリプトームデータ、公刊文献情報などを組み合わせたデータ解析手法を開発しました。
まず、遺伝子発現データベース「Gene Expression Omnibus」に所収のトランスクリプトームデータと転写制御データベース「GeneHancer」を組み合わせて、統合失調症患者特異的に変動している脂質代謝関連遺伝子とその転写因子から成る遺伝子回路(転写制御ネットワーク、DRN:differentially regulated networks)を再構築しました。統合失調症患者の脳や皮膚などでは脂質組成の変化が報告されていることから、脂質代謝は統合失調症との関連が指摘されています。再構築した脂質代謝酵素のDRNでは、エンハンサーを介した制御が全14,215の制御関係(エッジ)のうち53.3%(7,577エッジ)を占めており、プロモーターによる制御だけを考慮する従来のアプローチでは見逃されていた大規模な遺伝子回路の存在が浮かび上がりました(図1)。
図1 転写因子とエンハンサーおよびプロモーターの関係
エンハンサーを考慮することで、従来のプロモーターのみの場合に見逃していたDRNを再構築できる。
(左)ターゲット遺伝子の上流に位置するプロモーター配列や、そこから離れた場所に位置するエンハンサー配列に結合した転写因子によって、ターゲット遺伝子の発現が調節される。転写因子自体の遺伝子も同様の調節を受ける。
(右)左のような因果関係を矢印の起点と終点として単純化した図。エンハンサーを介した調節を考慮することにより、点線で囲われた部分のDRNが明らかとなった。
さらに、DRN同士を比較することで、トランスクリプトームデータセット間で共通して出現するネットワークが明らかになりました(図2)。例を挙げると、LEF1という転写因子が自己の転写を制御するエッジは全15データセット中6個に出現し、いずれも何らかの形でエンハンサーを介する制御でした。転写因子の自己制御はLEF1が6個のデータセットに共通して見つかった以外にも、転写因子のFOSL2、ZIC2が5個で、ATF3、EHMT2、FOS、PBX2、SCRT2が4個のデータセットに共通して出現しました。また、脂質代謝関連酵素ではCYP1B1、DGKB、ELOVL2、MBOAT7、PLPP3、SCD5、SPHK1を含むエッジが3個以上のデータセットで出現しました。これらの転写因子の自己制御に関わるエッジは、複数の統合失調症患者に共通する脂質代謝酵素のDRNを構成する可能性があります。
図2 合計3個以上のトランスクリプトームデータセットに登場するエッジから成るDRN
図中の矢印は、始点が制御する側の因子(原因)、終点が制御される側の因子(結果)であることを示す。転写因子レイヤー1やレイヤー2に属する複数の転写因子を囲む枠は、枠内の転写因子群全てに対して枠外から同じ入出力エッジが介在することを示す。
次に、DRNを構成する遺伝子の発現量に影響するSNPをリストアップし、当該SNPと関連することが分かっている疾患・形質にどのような特徴があるか統計的に解析しました。SNPのリストアップにあたっては、ヒトの遺伝子型[10]と遺伝子発現との関連について網羅的データを整備しているGTExプロジェクト[11]のデータを用いました。統計的解析の結果、本研究で再構築したDRNに紐付くSNPには、統合失調症などの精神疾患だけでなく、免疫や炎症に関連する疾患・形質、血球系細胞の数、皮膚、眼などと関連するものが多く含まれていることが明らかになりました(図3)。
図3 DRNと紐付いたSNPに関連する疾患・形質の特徴
横軸:再構築したDRNとの関連が示唆された疾患・形質名、縦軸:統合失調症と当該疾患・形質の両方を扱った論文の数。グラフの下側にプロットされた赤枠内の疾患・形質は、論文数が比較的少ないことを意味するため、統合失調症と絡めた研究がまだ進んでいないことを示す。上側にプロットされた青枠内の疾患・形質は、多数のトランスクリプトームデータセットに共通して有意に多く現れることを意味するため、転写制御ネットワークの一部を統合失調症のそれと共用している可能性がある。(This figure partly includes Fig. 4c of Okamoto et al. (2022) Neurosci. Res., licensed under CC BY 4.0/modified from the original.)
これらの疾患・形質と統合失調症との関連が過去にどの程度研究されているかを明らかにするため、医科学文献データベースPubMedを用いて関連する既刊原著論文の数を調べました。その結果、これまで、血球系細胞の数や眼などに関する形質と統合失調症との関連する報告例が少ないことが分かりました。血球系細胞の数に関連する遺伝子には、図2で示したDRNにも登場するヒストンメチル基転移酵素EHMT2[12]などが含まれました。
今後の期待
脂質代謝酵素を制御するDRNが複数のデータセットに共通して出現していたことを考慮すると、今後はリピドーム(脂質の総体)など他のオミクス[3]データと組み合わせることで、統合失調症と脂質代謝の間をつなぐ分子基盤の手掛かりが得られる可能性があります。また、患者の遺伝子型や併発疾患情報も併せて利用可能となれば、統合失調症と関連疾患との共通の分子基盤の解明に貢献するものと期待できます。
本研究によって示唆された血球系細胞数と統合失調症との関係は、現時点では十分に明らかになっているとはいえません。しかし過去には、白血病を発症した統合失調症患者が白血病治療のために骨髄移植を受けたところ、統合失調症も寛解したという事例が報告されています注1)。実際、本研究で複数のDRNに共通して出現した転写因子LEF1については白血病との関連が報告されています注2)。また、統合失調症治療薬の一つであるクロザピンには、ある種の血球系細胞の数を減少させる副作用が知られています。これらの報告は、統合失調症と血球系細胞数の間に何らかの関連があるのではないかという予測とつながる可能性があります。今後は、統合失調症と血球系細胞数の調節に共通する分子基盤についての研究の進展が待たれます。
本研究がヒントを得たOSINTの経験則では、「知りたいことの9割は公開情報をつなぎ合わせることで分かる」とされています注3)。もし、この経験則が生命科学にもあてはまるのであれば、公共データベースなどの公開情報を用いた予測や仮説生成により、必要となる実験の対象をかなり絞り込むことができるはずです。実際、物理学では理論物理学者による予測を実験物理学者が実験的に検証することで、体系がより強固になるというサイクルが確立されています。従って、生命科学におけるOSINT的な予測・仮説生成手法の発展は、実験的検証の方向性を意思決定する際により良い判断材料(インテリジェンス)を与え、発見のサイクルを加速するものと期待できます。
注1)Miyaoka, T. et.al. Remission of psychosis in treatment-resistant schizophrenia following bone marrow transplantation: a case report”, Front. Psychiatry, 8, 174 (2017).
注2)Metzeler, K.H. et.al. High expression of lymphoid enhancer-binding factor-1 (LEF1) is a novel favorable prognostic factor in cytogenetically normal acute myeloid leukemia”, Blood, 120, 2118-26 (2012).
注3)Benes, L. “OSINT, new technologies, education: expanding opportunities and threats. a new paradigm”, J. Strateg. Secur., 6, 22-37 (2013).
補足説明
1.遺伝子回路(転写制御ネットワーク)
遺伝子の転写を活性化あるいは不活性化する転写因子およびそのターゲットとなる遺伝子から成るネットワーク。
2.統合失調症
精神疾患の一つ。症状には幻覚や妄想などの「陽性症状」と、無気力や感情障害などの「陰性症状」があり、認知機能障害(記憶力、注意力、判断力の低下)を伴うこともある。有病率は人口の約1%とされている。
3.トランスクリプトーム、オミクス
細胞や組織を構成する分子を網羅的に計測して得た情報をオミクスと呼ぶ。トランスクリプトームは、任意の細胞や組織で発現する全RNAを指すオミクスである。
4.メタ解析
過去に実施された複数の研究により得られたデータを統合し、マクロ的見地から再解析すること。
5.一塩基変異(SNP)
遺伝情報1塩基の違いのこと。人口の1~5%以上に存在するとされ、ヒトの形質や疾患の遺伝的な要因になるものもある。SNPはSingle Nucleotide Polymorphismの略。
6.エンハンサー
遺伝子の転写効率を高める機能を持つ調節配列であり、遺伝子または遺伝子群の上流もしくは下流にやや離れて位置する。エンハンサーからはRNAが双方向に転写されており、標的とする遺伝子のmRNA発現量と相関する。
7.転写因子
DNAに結合して転写開始を促進または抑制するタンパク質。遺伝子上流のプロモーター部位を認識してRNAポリメラーゼの足場となるタンパク質複合体を形成するほか、エンハンサー部位に結合して転写の効率を調節する。
8.プロモーター
遺伝子の上流にある塩基配列で、転写開始時にRNAポリメラーゼが結合し、遺伝子を発現させる機能を持つ。プロモーター付近に形成される転写開始複合体はコアクチベーターと呼ばれる因子と相互作用する。当該コアクチベーターは、エンハンサーに結合した転写活性化因子とも相互作用する。この結果、プロモーターとエンハンサーが接近してDNAがループ状に屈曲すると考えられている。
9.公開情報に基づくインテリジェンス(OSINT)
出版物や各種メディアを介して公開された情報に基づくインテリジェンス活動のこと。近年、インターネットを利用して個人から発信される情報が急増したことから、その重要性を増している。本研究ではこれにヒントを得て、公開されている大規模生命科学データを、公共パスウェイデータベースなどを用いて解釈し、生体機能や疾患の背後にあるメカニズムに関する仮説を立てるという意味で用いた。OSINTは Open-source intelligenceの略。
10.遺伝子型
両親から一つずつ受け継いだ遺伝子1対の組み合わせを「遺伝子型(genotype)」といい、遺伝子型に対応する個々の形質を「表現型(phenotype)」という。例えばABO式血液型は表現型の一つであり、これを決定するABO遺伝子の組み合わせは遺伝子型である。
11.GTExプロジェクト
ヒトの組織特異的な遺伝子発現と遺伝子型との関連を明らかにすることを目指し、大規模データ基盤を整備している国際プロジェクト。死後のドナーから臓器や組織の提供を受けて、ヒトの体組織や遺伝子型ごとの遺伝子発現の網羅的な調査を行っている。
12.ヒストンメチル基転移酵素EHMT2
ヒストンH3タンパク質のリジン残基をメチル化(H3K9me2)し、遺伝子発現を調節する酵素。GeneHancerでは広義の転写因子として扱われている。
共同研究グループ
理化学研究所 生命医科学研究センター 統合細胞システム研究チーム
チームリーダー 柚木 克之(ゆぎ かつゆき)
研修生 岡本 理沙(おかもと りさ)
研修生 渡部 素世香(わたなべ そよか)
研修生 出野 泉花(での せんか)
訪問研究員 聶 翔(にえ しょう)
(日本学術振興会(JSPS) 特別研究員)
研究員 丸山 順一(まるやま じゅんいち)
慶應義塾大学 先端生命科学研究所
所長 冨田 勝(とみた まさる)
新潟大学 医歯学系 システム生化学分野
助教 幡野 敦(はたの あつし)
研究支援
本研究は、日本学術振興会(JSPS)科学研究費補助金新学術領域研究(研究領域提案型)「マルチスケール精神病態の構成的理解(領域代表者:林(高木)朗子)」における計画研究課題「精神病態の分子基盤解明を可能にする次世代トランスオミクス技術の開発(研究代表者:柚木 克之)」、同若手研究(A)「トランスオミクスによる疾患特異的ネットワークの同定と制御(研究代表者:柚木克之)」、科学技術振興機構(JST)戦略的創造研究推進事業(さきがけ)「疾患における代謝産物の解析および代謝制御に基づく革新的医療基盤技術の創出(研究総括:小田吉哉)」、慶應義塾大学先端生命科学研究所教育研究事業(山形県および鶴岡市からの補助金)などによる支援を受けて行われました。
原論文情報
Lisa Okamoto, Soyoka Watanabe, Senka Deno, Xiang Nie, Junichi Maruyama, Masaru Tomita, Atsushi Hatano, Katsuyuki Yugi, “Meta-analysis of transcriptional regulatory networks for lipid metabolism in neural cells from schizophrenia patients based on an open-source intelligence approach”, Neuroscience Research, 10.1016/j.neures.2021.12.006
発表者
理化学研究所
生命医科学研究センター 統合細胞システム研究チーム
チームリーダー 柚木 克之(ゆぎ かつゆき)
報道担当
理化学研究所 広報室 報道担当