2023-04-27 東京大学
半場 悠(研究当時:生物科学専攻 博士課程/現在:理化学研究所 リサーチアソシエイト)
角田 達彦(生物科学専攻 教授/大学院新領域創成科学研究科(兼担)/理化学研究所(チームリーダー))
発表のポイント
- 人の組織で、長鎖遺伝子間非翻訳RNA(lincRNA)の遺伝子が、タンパク質コード遺伝子に比べて染色体のトポロジカルドメイン(TAD)のより内部の領域に局在していることや、TAD内のlincRNAはTAD外部のものよりも発現の組織特異性が高いことを明らかにしました。
- lincRNAを指標として転写状態を解明するための解析フレームワークを提案し、肥大型心筋症を解析したところ、ケラチンの異常発現や、lincRNAの発現低下による筋細胞分化関連遺伝子の抑制解除という、肥大型心筋症に特有な転写制御を発見しました。
- 将来的に、ゲノムの立体構造によるlincRNAの機能や制御が解明され、医学応用が可能になります。
本研究の概要図
発表概要
東京大学大学院理学系研究科の半場悠博士課程大学院生(研究当時。現在、理化学研究所生命医科学研究センターリサーチアソシエイト)・角田達彦教授(新領域創成科学研究科教授・理化学研究所生命医科学研究センターチームリーダー)らによる研究グループは、人の組織での長鎖遺伝子間非翻訳RNA(lincRNA:(注1))の発現と染色体のトポロジカルドメイン(TAD:(注2))のデータを用い、lincRNAの遺伝子座がタンパク質コード遺伝子(PCG)に比べてTADの内側の領域に著しく局在することや、TAD内のlincRNAはTAD外のlincRNAよりも発現の組織特異性が高いことを明らかにしました。そしてこれらに基づき、lincRNAを指標として転写状態を解釈するための解析フレームワークを提案しました。これを肥大型心筋症のデータに適用し、TADレベルのケラチンの異常発現、LINC00881の発現低下に伴うE2F1転写因子による筋細胞分化関連遺伝子の発現の抑制解除という、肥大型心筋症に特有の転写制御を発見しました。本成果により、将来的にゲノムの立体構造に依存したlincRNAの機能や制御が理解され、その医学的応用が可能になります。
発表内容
〈研究の背景〉
人のゲノムの大部分は、タンパク質に翻訳されるmRNAに加えて、多くの非翻訳RNA(ncRNA)に転写されます。ncRNAの中で、長鎖非翻訳RNA(lncRNA)は200塩基対より長いものとして定義されます。lncRNAはタンパク質に翻訳されることなく、遺伝子インプリンティング、発生や免疫応答などの多くの細胞プロセスで機能することがわかっています。これらのさまざまなメカニズムの中で、多くのlncRNAがクロマチン修飾複合体と結びつき、核内ドメインの構造変化や転写エンハンサー活性の制御を導くことが報告されています。さらに、lncRNAの機能不全は、がん、心血管疾患、神経変性疾患など、さまざまな病気と関連しています。その中の長鎖遺伝子間非翻訳RNA(lincRNA)はタンパク質コード遺伝子(PCG)のプロモーターやエンハンサーとは独立した転写制御部位を持ち、lincRNAの発現はPCGに比べ細胞種や組織に非常に特異的です。翻訳されたタンパク質が機能するmRNAとは異なり、lincRNA転写物はそれ自体で直接機能を発揮するため、その特異的な発現を制御する分子基盤を解明することが重要です。そのメカニズムは、プロモーター配列やエピゲノム修飾の観点から広く研究されていますが、lincRNAの性質やこのmRNAとlincRNAの発現特異性の違いを、組織およびゲノム全体の制御システムとして包括的に説明するメカニズムは未だ不明でした。
一方、転写を制御する高次の制御機構の一つとして染色体の立体構造があげられます。特に近年の実験技術の進歩により、染色体領域の各座位は、数百kbから1-2Mbの大きさのトポロジカルドメイン(TAD)に折り畳まれていることが示されました。そして遺伝子発現もTAD単位で制御され、TAD内のエンハンサーによる制御によって、いつ、どの組織でlincRNAが近くの遺伝子と一緒に転写されるかが決まっていることが示唆されています。私たちは、このTADの性質から、TADは上記のゲノム全体に見られるlincRNAの組織特異的な発現パターンと密接に関係するのではないかと考えました。
〈研究の内容〉
上記の仮説を検証するため、本研究では、米国のGTExプロジェクト(注3)のヒトの54の組織の発現データと、13の組織のTADのデータを組み合わせた解析を行いました。
まず、GTExの54組織の発現データを全ゲノム上で調べたところ、lincRNAの発現はPCGよりも組織特異性が高いことがわかりました。つまり、lincRNAには、PCGとは異なる組織特異的な発現パターンをもたらす全ゲノム上の制御機構が存在する可能性があります。
次に、ヒトの13の組織で調べられたゲノム上のTADの位置に対し、lincRNAがある位置を調べたところ、lincRNAはTADの外部よりも内部により多くみられることがわかりました(図1)。すなわち、lincRNAは、たまたま翻訳されていない転写産物の集まりというわけではなく、TADなどの染色体の立体構造で積極的に制御されている可能性があります。また、TAD領域内外の遺伝子発現の組織特異性についても全ゲノム上で検討したところ、TADの中にあるlincRNAは、PCGやTADの外部にある他のlincRNAよりも発現の組織特異性が高いことがわかり(図1)、TADがlincRNAの組織特異的な発現の基盤となる可能性が示唆されました。さらに、遺伝子間の距離に関わらず、同じTAD内のlincRNAやPCGどうしは、TAD外のペアよりも発現に高い相関が見られることを全ゲノムレベルで示しました。そしてTAD内の遺伝子のうち、lincRNAはPCGに比べてTADのより内側の位置にあることもわかり、lincRNAはTADの中核的な因子として機能している可能性が示されました。
図1:lincRNAの発現の組織特異性とTADとの関係
人のさまざまな組織の発現データとゲノム上のTADの位置をもとに、lincRNAやタンパク質をコードする遺伝子のmRNAの発現を、TAD内外で比較したところ、lincRNAはTADの外よりも中心部に多いことや、TAD内にあるlincRNAが他のlincRNAや遺伝子に比べて顕著に組織に特異的に発現することなどが分かった。
このように、lincRNAの発現パターンはPCGよりも細胞や組織に特異的であり、それらの状態をよく反映する分子と考えられましたので、本研究グループはさらに医学応用のための解析方法を考案しました(図2)。まず、病気の組織と健康な組織とで異なる発現量を示すlincRNAを特定します。次に、lincRNAがあるTAD内でlincRNAと似た発現パターンを示す遺伝子群を見出します(図2左下)。これらの遺伝子群に対して遺伝子オントロジー解析(注4)をすることで、機能を推定します。
図2:lincRNAの発現とTADの関係をもとにした医学応用のための解析方法
患者の病気の組織からの発現データを、健康な組織と比べて発現の違いが見られるlincRNAを同定する(上)。TAD内の同様な発現パターンを示す遺伝子群から、lincRNAの機能を推定する(左下)。またlincRNAは遠い場所や別の染色体にある遺伝子には抑制性に働くことから、lincRNAと逆の発現パターンを持つ遺伝子群を同定し、それらの遺伝子群の上流の因子を推定する(右下)。
この提案方法の解析例として肥大型心筋症(HCM)を対象にしました。HCMは、多くの場合サルコメア関連遺伝子の変異が原因となりますが、遺伝子異常が特定できない症例も多く、発症の分子機構の解明と治療法の開発が求められています。そこでHCMの病態に関連するlincRNAと遺伝子を同定し、その経路を解明しました。まず、HCMの患者の心筋組織では健康な心筋組織に比べ、132個のlincRNAが高く発現し、140個のlincRNAが低く発現していることがわかりました。そしてそのうち113個は、遺伝子の平均発現量に違いが見られた11箇所のTAD内にありました。そこでこれらのTAD内にあり発現の差が同様に見られた遺伝子群に対して遺伝子オントロジー解析を行なったところ、ケラチンなどによる角化に関連した遺伝子が多くみられることがわかりました(図3)。すなわち、心筋ストレスに対して、いくつかの異なるケラチン分子が心筋保護に寄与することが示唆されました。
図3:肥大型心筋症の患者の心筋組織と健康な心筋組織とを比較し得られた結果
本研究で提案した方法により、肥大型心筋症の患者の心筋組織を解析すると、健康な心筋組織に比べてケラチン関連の多くの遺伝子群に発現の違いが認められ(左)、発現が低いケラチン関連遺伝子群や(中)、発現が高いケラチン遺伝子群が見られる(右)ことが分かった。
もう一つの方法として(図2右下)、lincRNAは近傍の遺伝子群だけでなく、他の染色体の遺伝子にも抑制性の作用(トランス制御)を及ぼすことも考慮すると、lincRNAと逆の発現パターンを持つゲノムワイドな遺伝子群を同定すれば、それらの機能が推定できます。そこで、HCMの患者と健康な人とで心筋組織での発現に差が見られ、それらが互いに抑制的な関係を示すlincRNAとPCGの対を探したところ、LINC00881というlincRNAと15個のPCGを見出しました。LINC00881は分化後の心筋細胞に特異的に発現することが知られていますが、HCMでは減少していました。またLINC00881と負の発現量の相関を示した15個のPCGに対して遺伝子オントロジー解析を行なったところ、心筋細胞の発達が関係していることもわかりました。さらにそれらの上流にあり共通する転写因子を探索すると、E2F1に絞り込まれました。つまり、HCMの病態には、E2F1が関わるLINC00881の発現低下が関与している可能性があり、それらが今後の治療標的の候補となりえます。
〈今後の展望〉
本研究は、lincRNAの組織/疾患特異的な発現を支える分子基盤の基礎的理解に貢献します。私たちの発見は、ゲノムの立体構造の一つであるTADを解明することで、lincRNAの機能性に関する洞察が得られることを実証しました。今後、ゲノムの立体構造の観点でさらに解析することで、さまざまなゲノム要素の機能と制御について新たな理解が得られ、治療標的が見つかる可能性が示されました。
論文情報
- 雑誌名
iScience論文タイトル
Topologically associating domain underlies tissue specific expression of long intergenic noncoding RNAs著者
Yu Hamba, Takashi Kamatani, Fuyuki Miya, Keith A. Boroevich, Tatsuhiko Tsunoda
研究助成
本研究は、科研費「特別研究員奨励費(課題番号:JP19J22115)」の支援により実施されました。
用語解説
注1 長鎖遺伝子間非翻訳RNA(long intervening/intergenic non-coding RNA; lincRNA)
タンパク質へ翻訳されない200塩基以上の長さの転写産物である長鎖非翻訳RNA(long non-coding RNA; lncRNA)のうち、タンパク質をコードする遺伝子領域とは重複しない領域に位置するもの。
注2 トポロジカルドメイン(topology associating domain; TAD)
ゲノム上で近くの配列どうしが物理的に相互作用し合っている領域。図1参照。
注3 GTExプロジェクト(The Genotype-Tissue Expression (GTEx) Project)
組織特異的な遺伝子発現と制御を研究するための包括的な公開リソースを構築するためのプロジェクト。約1000人分の非疾患の組織54部位からサンプルが収集され、ゲノムや網羅的な遺伝子発現データが取得されている。
注4 遺伝子オントロジー解析
対象として与えられた遺伝子群に共通する性質を、生物学的プロセス、細胞の構成要素、分子機能の3つの観点から解析する手法。