2019-10-17 理化学研究所,東京大学,日本医療研究開発機構
理化学研究所(理研)生命医科学研究センターゲノム解析応用研究チームの寺尾知可史チームリーダー、鎌谷洋一郎客員主管研究員(東京大学大学院新領域創成科学研究科教授)らの国際共同研究グループ※は、男性の性染色体であるY染色体を喪失した細胞が血中に増加する現象(mLOY)における遺伝機構や重要な血液細胞の分化段階、転写因子などを明らかにしました。
今回、国際共同研究グループは、バイオバンク・ジャパン[1]の男性登録者95,380人のDNAマイクロアレイ[2]データを解析しました。その結果、ヨーロッパ系人種で見られる加齢や喫煙によるmLOYの発生が日本人でも確認され、さらにmLOYを起こりやすくする31の関連遺伝領域(日本人独自のものを含む)を新たに同定しました。また、遺伝統計学的な解析を行ったところ、造血幹細胞にmLOY関連シグナルの集積が見られ、特に強くシグナルの集積が見られる血球分化の初期細胞を同定しました。さらに、mLOYにおいて重要な役割を果たす転写因子[3]FLI1を同定し、mLOYのマーカーとなりうる指標も同定しました。そして、54,887人のデータを用いてmLOYと疾患の関連を解析した結果、総死亡率やがんの死亡率の上昇とmLOYとの明確な関連は認められませんでした。
本研究成果は、加齢に伴う染色体変化やがんの発生機構の解明に向けた基礎医学とY染色体喪失を予測する臨床医学の進歩に貢献すると期待できます。また、DNAマイクロアレイデータは、全世界で数百万人以上の規模で存在し、これまでそのシグナル情報は生まれつきの変異の同定にのみに使われてきました。今回、このデータには後天的な染色体変化の情報が含まれていることが明確になり、そのメカニズムの一端を解明できました。今後、既に利用可能なこれらのシグナル情報を集約させることによって、日本人に特有な機構を含む詳細なmLOYの機構が解明され、老化やがん化のメカニズムの解明につながると期待できます。
本研究は、英国のオンライン科学雑誌『Nature Communications』(10月17日付け)に掲載されます。
- ※国際共同研究グループ
- 理化学研究所
- 生命医科学研究センター
- ゲノム解析応用研究チーム
チームリーダー 寺尾 知可史(てらお ちかし)
(静岡県立総合病院 臨床研究部 免疫研究部長、静岡県立大学 薬学部 ゲノム病態解析講座 特任教授)客員主管研究員 鎌谷 洋一郎(かまたに よういちろう)
(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 複雑形質ゲノム解析分野 教授)客員研究員 秋山 雅人(あきやま まさと)
(九州大学 医学部 眼科 特任講師)客員研究員 石垣 和慶(いしがき かずよし)
(米国ハーバード大学 ポスドクフェロー) - 基盤技術開発研究チーム
チームリーダー 桃沢 幸秀(ももざわ ゆきひで)
- 免疫器官形成研究グループリサーチ・アソシエイト 椙下 紘貴(すぎした ひろき)
- 統合生命医科学研究センター(研究当時)副センター長 久保 充明(くぼ みちあき)
- 医科学イノベーションハブ推進プログラム
- 健康データ数理推論チーム
チームリーダー 川上 英良(かわかみ えいりょう)
(理化学研究所 医科学イノベーションハブ推進プログラム 健康医療データ AI予測推論開発ユニット・ユニットリーダー、 千葉大学大学院医学研究院 人工知能(AI)医学・教授 治療学人工知能(AI)研究センター・センター長)
東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 クリニカルシークエンス分野
教授 松田 浩一 (まつだ こういち)
東京大学医科学研究所
ヒトゲノム解析センター シークエンス技術開発分野(研究当時)
特任助教 平田 真(ひらた まこと)
- 癌・細胞増殖部門 人癌病因遺伝子分野
教授 村上 善則(むらかみ よしのり) - 情報・システム研究機構 ライフサイエンス統合データベースセンター
特任研究員 大田 達郎(おおた たつろう)
ブリガムアンドウィミンズ病院 遺伝学分野
助教 ポールー・ロー(Po-Ru Loh)
ハーバード大学 遺伝学分野
研究員 ジウリオ・ジェノヴェーゼ(Giulio Genovese)
ケンブリッジ大学 MRC疫学分野
助教 ジョン・ペリー(John R.B Perry)
※研究支援
本研究は、日本医療研究開発機構(AMED)のオーダーメイド医療の実現プログラム「疾患関連遺伝子等の探索を効率化するための遺伝子多型情報の高度化(研究開発代表者:久保充明)」の支援のもと行われました。本研究で使用したサンプルは、「オーダーメイド医療の実現プログラム」において収集されたものです。
背景
ヒトは22対の常染色体と1対の性染色体を持っており、女性の性染色体はXXで、男性の性染色体はXYです。男性特有の性染色体であるY染色体は、X染色体に比べて短く、遺伝子の数も少ないという特徴があります。
ヒトの体は、受精後に細胞分裂を繰り返し、生殖細胞の一部以外は基本的に同じDNA配列を持った細胞で構成されます。しかし、以前よりY染色体を喪失した細胞がしばしば見られることが知られており(主に血中に)、これを「Y染色体を喪失した細胞とY染色体を維持した細胞がモザイクとなった状態(mosaic loss of chromosome Y[mLOY]) といいます。そして、mLOYは加齢や喫煙に強く相関しており、加齢や喫煙に伴ってY染色体が喪失した細胞が増えることが分かってきました。
その後、欧米人の検体を用いた研究により、mLOYが発がんのリスクとなる可能性や、がん患者の悪い予後に関わる可能性が示されました。また、一塩基多型(SNP)[4]を用いた詳しいゲノムワイド関連解析(GWAS)[5]により、mLOYに関わる遺伝子も見つかっており、2017年には、英国のUKバイオバンク[6]のデータを用いた研究により、19のmLOY関連遺伝子が見つかっています 注1)。
一方、これまで報告されてきた研究の多くはヨーロッパ系人種における解析であり、日本人をはじめアジア系人種における解析はほとんど進んでいませんでした。そこで国際共同研究グループは、日本人における大規模コホート[7]である、東京大学医科学研究所が管理するバイオバンク・ジャパンに登録された男性のデータを解析し、日本人におけるmLOYの発生と関連遺伝子領域、遺伝的なデータが示すmLOYの分子機構や臨床的な意義について解析を試みました。
- 注1)
- Wright DJ, Day FR, Kerrison ND, Zink F, Cardona A, Sulem P, Thompson DJ, Sigurjonsdottir S, Gudbjartsson DF, Helgason A, Chapman JR, Jackson SP, Langenberg C, Wareham NJ, Scott RA, Thorsteindottir U, Ong KK, Stefansson K, Perry JRB. Genetic variants associated with mosaic Y chromosome loss highlight cell cycle genes and overlap with cancer susceptibility. Nat Genet. 2017 May;49(5):674-679. doi: 10.1038/ng.3821.
研究手法と成果
国際共同研究グループはまず、2017年の英国の報告に類似した方法により、バイオバンク・ジャパンに登録された男性95,380人のDNAマイクロアレイデータを用いて、Y染色体の遺伝的多型[4](この場合はSNP)のシグナルの強さをもとに、各個人のY染色体の相対量(便宜的にmLOYシグナルとします)を推定しました。mLOYシグナルは、各個人の血中の細胞の中で、Y染色体の喪失が起こっている細胞と起こっていない細胞の比率の推定値を表しており、mLOYシグナルが強いほどY染色体の相対量が少ないことを示します。本手法で推定したmLOYシグナルがこれまで報告された加齢や喫煙といった指標と関連しているか調べた結果、mLOYシグナルは、それらと強く関連していることが分かりました(図1)。このことは、本手法の正しさを示すものです。
図1 Y染色体の相対量(mLOYシグナル)と年齢・喫煙の関係
年齢ごとに解析対象者を分け、Y染色体の相対量であるシグナルの強さを表したもの。喫煙者と非喫煙者でも分類した。Y染色体の相対量が少ないほどmLOYシグナルが強いことを示す。加齢とともにmLOYシグナルが強くなり、また全ての年齢において喫煙者の方が非喫煙者と比べて、mLOYシグナルが強いことが分かる。
次にGWASにより、mLOYシグナルと関連する生まれつきの遺伝的多型を探索しました。日本人約1,000人を含む参照配列[8]を用いて、全ゲノム領域の遺伝的多型(主にSNP)の遺伝子型を推定し、混合効果モデル[9]という手法によって解析した結果、46の遺伝領域がmLOYシグナルと有意に関連していることが分かりました(図2)。これら46の領域にはがん関連遺伝子が多く含まれており、細胞分裂の遺伝子パスウェイ[10]に集中が見られました。これら46領域のうち、31領域は今回新たに発見されたものです。また、46領域の中で4領域はニつの独立したシグナルを持つこと(一つの領域の中の複数のSNPが独立してmLOYと関連すること)、15領域は2017年に報告された19領域に含まれていることが分かりました。
さらに、46領域の中で39の領域の遺伝的多型が、英国人でもある程度の遺伝的多型性を示すこと、そのうち37の遺伝的多型のアレル(対立遺伝子座位)[11]は日本人と同じmLOYを増やす方向で関連していました。このことは、mLOYが人種共通の遺伝的背景を持っていて、また、このような先天的な遺伝的多型が、mLOYという後天的な形質を規定していることを意味します。一方で、46領域の中の7領域は英国人では遺伝的多型性が低く、日本人データだからこそ判明した関連領域でした。さらに、英国人で最も強く関連していた領域は、今回日本人では全く関連を認めませんでした。このことは、英国人で多型性がある一方で日本人に多型性のない遺伝的多型がこの領域のmLOYとの関連の原因であるということを強く示唆しています。
図2 mLOYシグナルに関連する遺伝領域
横軸が各染色体におけるSNPの位置、縦軸が関連の強さを示す。破線が有意水準で、これよりも上位のSNPが有意と判定される。46領域がmLOYシグナルと有意に関連しており、そのうち31領域は新規に発見されたものである。
また、mLOYにおいての細胞特異性を調べるために、46領域の各領域の中で最も強い関連を示す遺伝的多型が、細胞特異性が高いエンハンサー[12]領域に集中していないかを調べました。その結果、造血幹細胞のエンハンサーと強く関連することが分かりました(図3A)。さらに、有意水準に満たない領域に関して、mLOYの遺伝率[13]を解析したところ、やはり造血系の細胞群にmLOYとの関連が見られ、しかも造血幹細胞や血液前駆細胞に発現しているマーカーであるCD34陽性細胞[14]のエピゲノム[15]変化が見られるDNA塩基に集中していることが分かりました(図3B)。このことは、造血幹細胞や血液前駆細胞に発現している遺伝子がmLOYの発生に重要であることを示しています。つまり、造血の早い段階からY染色体が喪失した細胞が出現し、その細胞由来の血液細胞が増殖することで、Y染色体を維持した血液細胞とのモザイク状態となることを強く示唆しています。
図3 mLOYの発生に重要な細胞としてのCD34陽性細胞の同定
A:有意な46領域の最も関連の強いSNPと細胞特異的エンハンサーとの重なりを評価した。実線が有意水準でこれより上位が有意と判定される。細胞種を臓器や機能でグループ化して別の色を付与した。CD34陽性造血幹細胞がエンハンサーと強く関連している。
B:ゲノムワイド関連解析シグナル全体での遺伝率(横軸)と、細胞特異的なエピゲノム領域(縦軸)との重なりを評価した。破線が有意水準でこれより右位が有意と判定される。細胞種を臓器や機能でグループ化して別の色を付与した。エピゲノムについてもそれぞれの種類ごとに別の色を付与した。造血幹細胞や血液前駆細胞に発現しているCD34陽性細胞において、エピゲノム変化が見られる場所に集中している。
造血幹細胞は、骨髄においてさまざまな段階を経て、赤血球、白血球、血小板へと分化していきます。そこで、造血のどの段階における遺伝子がmLOYの発生に重要なのかを調べるため、連鎖不平衡スコア回帰[16]と呼ばれる手法を用いて、造血の詳細な分化段階での遺伝子発現データと強く関連するATACシーケンス[17]データを解析しました。その結果、mLOYは、造血幹細胞と造血幹細胞が分化した段階と考えられている多能性前駆細胞の二つの細胞のデータと強く関連していることが分かりました。
造血の段階には、さまざまな転写因子と呼ばれるタンパク質が重要な役割を果たします。そこで、別の実験で得られた、造血幹細胞や血液前駆細胞における転写因子の結合部分とmLOYとの関連を調べました。その結果、FLI1と呼ばれる転写因子の結合がmLOYと最も強く関連していました(図4A)。FLI1は、造血が進んで細胞が血小板と赤血球のどちらの系統に分化するかを決める重要な転写因子で、血小板のほうへ分化を誘導する転写因子と考えられています。
そこで、血中の血小板あるいは赤血球がmLOYのマーカーとなりうる可能性を調べてみました。その結果、血小板の数が多い人ほどmLOYの程度の強い人が多く、赤血球については反対に赤血球の数が多いほどmLOYの程度の弱い人が多いことが分かりました(図4B)。このことは、解析で示されたFLI1のmLOYに対する影響が実際の検査結果からも示されただけでなく、血小板・赤血球・それらの比率がmLOYのマーカーとして使える可能性を示しています。
図4 mLOYに重要な転写因子FLI1とmLOYのマーカーとしての血小板・赤血球数
A. CD34陽性細胞の転写因子結合データにおけるmLOYの遺伝率の集積の評価。各棒グラフがそれぞれの転写因子を示す。破線は有意水準でこれより上位が有意と判定される。転写因子FLI1がmLOYと強く関連している。
B. 血球細胞の多寡とmLOYが強い人々との関連の評価。横軸は各血球数の多い人上位1、3、5、10%を示す。縦軸はそれぞれにおけるmLOYとの関連の強さ。血小板が多い人ほどmLOYの程度が強くなり、赤血球が多い人ほどmLOYの程度が弱くなる。
最後に、mLOYの臨床的意味合いを調べるため、バイオバンク・ジャパンの生存調査のデータと組み合わせて解析しました。mLOYのデータのあるバイオバンク・ジャパンに登録された男性の中で54,887人について解析が可能でした。解析の結果、mLOYはごくわずかに死亡率の上昇と関連する傾向にありましたが、明確な差はありませんでした。
次に、がんの死亡率の上昇との関連を調べました。その結果、mLOYは肺がんの死亡率の上昇と関わっている可能性がありました。しかし、mLOYは喫煙と関連しており、喫煙は肺がんと関連しています。非喫煙者のみで行った解析では、mLOYと肺がんの死亡率との関連は認められませんでした。当初の肺がん死亡率との関連解析では、喫煙の影響を除くように補正していましたが、この補正が十分でない可能性があり、mLOYと肺がんの死亡率の関連は明確でないと考えられます。
論文情報
- タイトル
- GWAS of mosaic loss of chromosome Y highlights genetic effects on blood cell differentiation
- 著者名
- Chikashi Terao, Yukihide Momozawa, Kazuyoshi Ishigaki, Eiryo Kawakami, Masato Akiyama, Po-Ru Loh, Giulio Genovese, Hiroki Sugishita, Tazro Ohta, Makoto Hirata, John R.B Perry, Koichi Matsuda, Yoshinori Murakami, Michiaki Kubo, Yoichiro Kamatani
- 雑誌
- Nature Communications
- DOI
- 10.1038/s41467-019-12705-5
補足説明
- [1] バイオバンク・ジャパン
- 日本人集団27万人を対象とした生体試料のバイオバンクであり、約20万人のゲノムデータを保有する。オーダーメイド医療の実現プログラムを通じて実施され、ゲノムDNAや血清サンプルを臨床情報とともに収集し、研究者へのデータ提供や分譲を行っている。
- [2] DNAマイクロアレイ
- 数万から数百万に区切られた基板の上に、DNAの部分配列を高密度に配置して固定した、遺伝的多型(主にSNP)を検出するための分析器具。
- [3] 転写因子
- DNA上のプロモーターやエンハンサーといった転写制御領域に配列特異的に結合するタンパク質。結合によってRNAポリメラーゼによる遺伝子の転写を調節する。
- [4] 一塩基多型(SNP)、遺伝的多型
- ヒトのDNA配列を個々人で比較すると、塩基配列の違い(遺伝子多型)が見いだされる。遺伝子多型のうち、一つの塩基が他の塩基に変わっているものを一塩基多型と呼ぶ。一塩基多型は稀なものを含めると数千万以上が知られている。SNPはSingle Nucleotide Polymorphismの略。
- [5] ゲノムワイド関連解析(GWAS)
- 形質に対する遺伝的関連を知るための手法であり、SNPを用いて解析するものが一般的である。形質(疾患のある/なし や量的形質)を目的変数、SNPの量的情報や各種共変量を説明変数にしてモデル化し、SNPの関連を評価する。GWASはGenome-Wide Association Studyの略。
- [6] UKバイオバンク
- 英国で構築されているバイオバンクであり、50万人規模の疾患罹患情報、臨床情報、遺伝情報などから構成される。
- [7] コホート
- 一定期間にわたって観察される同一の性質を持つ集団。コホート研究では、一定期間に集団を観察・追跡することにより特定の疾病に関わる共通の因子を検討する。
- [8] 参照配列
- 全ゲノム領域の遺伝子多型の遺伝子型を推測する(imputation)際に用いる、DNA全ゲノムシーケンスデータをもとにした配列のこと。
- [9] 混合効果モデル
- SNPと形質との関連を評価する際に、SNPや共変量(形質に関わるSNP以外の項目)に関して全員に共通の影響(固定効果)だけでなく各個人ごとのばらつき(変量効果)も含めてモデル化した手法。本手法によって、遺伝的にある程度近い人がデータに含まれていても、それらの影響を加味した上で検出力を高めて関連を見いだすことが可能となる。
- [10] 遺伝子パスウェイ
- 生体現象をつかさどる遺伝子の経路や制御関係のこと。
- [11] アレル(対立遺伝子座位)
- 哺乳類は母親と父親から同じ遺伝子セットを持つ染色体を1組ずつ受け継ぐ。この両親から受け継いだ1対の遺伝子セットを対立遺伝子座またはアレルと呼ぶ。
- [12] エンハンサー
- DNA上の遺伝子発現調節領域の一つ。転写因子が結合することにより、遺伝子の発現を調節する。調節を受ける遺伝子からは数万塩基離れていることもある。エンハンサーは転写効率を著しく高める。
- [13] 遺伝率
- 環境要因と遺伝要因の割合。遺伝率は0から1の値をとり、大きいほど遺伝要因から受ける影響が大きいことを示す。
- [14] CD34陽性細胞
- 造血幹細胞や血液前駆細胞のマーカーであるCD34が細胞表面に発現している血液系細胞のこと。実験に当たっては詳細に細胞の由来を同定されないことが多く、CD34の細胞表面の発現を指標に細胞を分離して解析が行われたことを意味する。
- [15] エピゲノム
- ゲノムDNAの塩基そのものや、DNA二重らせんが巻き付いて存在しているヒストンタンパク質に、後天的に施されるメチル化やアセチル化などの化学修飾のこと、あるいはその状態。
- [16] 連鎖不平衡スコア回帰
- SNPは集団でお互いの遺伝子型の関連を見ると連鎖しており、そのことを連鎖不平衡と呼ぶ。多型と形質との関連は、真の関連のある多型との連鎖の強さによって規定される。ほとんどの形質は、無数の多型がごく弱く関連して遺伝的に規定されている。これを利用して、多型ごとの連鎖不平衡の強さをスコア化し、遺伝率の推定や遺伝的な類似性の評価、遺伝率が特定の性質を持った領域に集中していないかどうかの評価を行うことが可能である。この方法を連鎖不平衡スコア回帰と呼ぶ。
- [17] ATACシーケンス
- ゲノム上の位置を移動できる塩基配列であるトランスポゾンの性質を利用した、クロマチンが開いた構造を示す場所を網羅的に同定する手法。従来の手法に比べて少ない細胞数で安定的な結果が得られる。
発表者・機関窓口
発表者
理化学研究所 生命医科学研究センター ゲノム解析応用研究チーム
チームリーダー 寺尾 知可史(てらお ちかし)
客員主管研究員 鎌谷 洋一郎(かまたに よういちろう)
機関窓口
理化学研究所
広報室 報道担当
東京大学大学院新領域創成科学研究科
広報室 TEL:04-7136-5450
AMED事業に関するお問い合わせ先
日本医療研究開発機構(AMED) 基盤研究事業部
バイオバンク課