2025-02-25 国立がん研究センター,理化学研究所,名古屋大学
発表のポイント
- 上部胃がんでは、脾門部リンパ節転移の可能性を踏まえ脾臓を摘出することがあります。しかし、脾臓の摘出は合併症の発生率が高く、また実際は転移していない場合もあるなどの課題もあり、脾門部リンパ節転移の確かな予測による適切な意思決定方法が求められています。
- 従来の頻度主義アプローチに基づく機械学習モデルは、1点推定値しか提供できず予測の不確実性を把握できないため、臨床現場での使用には適しておりませんでした。今回、ベイズ主義アプローチに基づく予測の不確実性に焦点を当てた意思決定に役立つ予測モデルの開発を試み、臨床病理学的特性から上部胃がんにおける脾門部リンパ節転移の個々の事後確率分布を可視化することに成功しました。
- Bayes-SHLNMモデルは、性能評価指標の受信者動作特性曲線下面積が0.83と優れた性能を示しました。
- 脾門部リンパ節郭清の適応として推奨されている大弯侵襲の有無で腫瘍を2つのカテゴリーに分けた場合、 Bayes-SHLNMモデルは大弯侵襲を伴わない症例では99%の症例で正確に陰性と予測されました。
- Bayes-SHLNMモデルは、侵襲的治療である脾門部リンパ節郭清を行うことの利点と、その症例で合併症を発症することの不利な点を理解した上で、その是非を評価し、議論するために使用できる効果的な個別指標を提供することが期待されます。
概要
国立がん研究センター(東京都中央区、理事長:中釜斉)、理化学研究所(埼玉県和光市、理事長:五神真)、名古屋大学(愛知県名古屋市、総長:杉山直)からなる共同研究グループは、機械学習の1つであるベイズロジスティック回帰(注1)を用いた、上部胃がんにおける脾門部リンパ節転移(注2)を予測するモデル「Bayes-SHLNM」を開発いたしました。
頻度主義アプローチ(注3)に基づく機械学習モデルは、不確実性を予測できないため、臨床実践の要件を満たすことができず、高性能なモデルであっても、臨床的判断のプロセスを変更することは困難でありました。今回研究グループが開発したBayes-SHLNMモデルは、ベイズ主義アプローチ(注4)を用い、不確実性を考慮した実行可能な洞察が求められる複雑な臨床判断に役立ちます。また本モデルは、事後確率分布を視覚化することで、不確実性と結果の幅を明らかにし、リスクが高く不確実な状況における臨床的判断に役立てることができます(図1)。
本研究は、国立がん研究センター研究所 医療AI研究開発分野の石津賢一がん専門修練医(研究当時)、高橋慧外来研究員(理化学研究所 革新知能統合研究センター・上級研究員)、浜本隆二分野長、国立がん研究センター中央病院 胃外科の吉川貴己科長、理化学研究所・名古屋大学の研究チームで実施しました。
この研究成果は、国際学術雑誌「npj Digital Medicine」オンライン版(2月11日付)に掲載されました。
図1 上部胃がんにおける脾門部リンパ節郭清の転移確率予測に関する頻度主義モデルとベイズ主義モデル(Bayes-SHLNM)の比較
脾臓摘出を伴う胃全摘術を受けた患者さんにおける脾門部リンパ節転移の確率を予測する際の、頻度主義モデルとベイズ主義に基づくロジスティック回帰モデルの異なるアプローチを示しています。頻度主義モデル(上部の経路)は、臨床、腫瘍、リンパ節の位置、病理学的情報から、転移の単一点確率推定値(例:72%)を生成します。一方、ベイズ主義モデル(下図)は、同じデータソースを使用しますが、事後確率分布を出力し、予測に関連する不確実性についてより包括的な見解を提供します。事後確率分布により、起こり得る結果の範囲を視覚化し、不確実性の度合いを強調することができ、リスクが高く不確実性の高い状況における情報に基づく臨床的判断を行う上で非常に重要です。
背景
胃がんは罹患率で世界第5位、がん関連死亡率で第4位となっております。過剰な切除は高い罹患率と短命をもたらすため、胃がんの根治的な治療の原則は、適切な領域リンパ節郭清を伴う外科的手術と考えられております。脾門部リンパ節は胃の上部3分の1における胃がんの領域リンパ節ですが、脾門部リンパ節の2.8~27.9%に転移が認められています。現在脾臓摘出を伴う脾門部リンパ節の切除が日本では幅広く行われていますが、脾臓摘出にはいくつかの欠点があり、特に術後合併症の発生率が高い(約20~30%)ことが、ランダム化比較臨床試験(注5)や後ろ向き研究で報告されており、特定の症例では生存率の改善効果を相殺することも示されております。以上のことから、がんの腫瘍学的状態に基づいて、適切な外科的アプローチを選択することが可能なツールを開発することの重要性が強まっております。実際、これまで胃がんのリンパ節転移を予測するための様々な機械学習モデルが発表されており、主に早期胃がんの内視鏡的切除の進行胃がんの予後を予測することに重点が置かれていました。しかしながら、手術計画やリンパ節郭清の範囲を変更しようとするモデルは開発されておりません。
本研究では、ベイズ主義アプローチに基づき予測の不確実性に焦点を当てた意思決定に役立つモデルの開発と、臨床病理学的特徴に基づく胃上部進行がんの脾門部リンパ節転移における、個々の事後確率の可視化を目指しました。
研究成果
1. ベイズ主義モデルと頻度主義に基づくロジスティック機械学習モデルの性能比較
本研究では、リンパ節郭清を伴う胃切除術を受けた患者さんのうち、原発性胃がんに対する脾臓摘出を伴う胃全摘術を受けた症例(n = 593)のデータを用いて、モデルを構築しました。続いて、4つのベイズ主義モデルと頻度主義に基づくロジスティック回帰(FLR)モデルに関して、5分割交差検証(5fCV)(注6)を用いて性能評価を行いました。その結果、4つのベイズ主義モデルのうち、Bayes-SHLNMモデルは、受信者動作特性曲線下面積(ROC-AUC)(注7)(0.83)とFLRモデルとほぼ同等の結果となりました(図2)。これらの結果から、Bayes-SHLNMはFLRモデルの代替として堅牢であることが示されました。脾門部リンパ節郭清の適応として推奨されている、大弯浸潤(GCI)(注8)の有無に基づいて腫瘍を2つのカテゴリーに分けた場合、両カテゴリーでほぼ20%の症例で両モデルが陽性と予測したのに対し、大弯浸潤を伴わない症例は99%の症例で正確に陰性と予測されました(表1)。Bayes-SHLNMとFLRの結果は類似していることが判明しましたが、大弯浸潤を伴わない症例ではBayes-SHLNMがわずかに良好な陽性的中度と陰性的中度を示しました。
図2 5分割交差検証法による平均結果に基づく、4つのベイズ主義モデルと1つの頻度論主義モデルの性能及び95%信頼区間の比較
ROC-AUCは、各モデルの真陽性率(感度)と偽陽性率を比較しました。Bayes-SHLNMモデルは、0.83という最高値のROC-AUC(0.74-0.91)を達成しました。各曲線の周囲の網掛け部分は、各モデルの95%信頼区間を表示しております。
【表1】Bayes-SHLNMモデルによる進行胃がんにおける大弯浸潤の有無による予測結果
2. Bayes-SHLNMモデルによる個々の患者さんに対する事後確率分布の表示
Bayes-SHLNMモデルを用いて推論された、脾門部リンパ節転移の確率の個々の事後分布の代表的な症例を、図3に示しております。図3aは、大弯浸潤を伴わない進行胃がんの症例です。日本胃癌学会(JGCA)ガイドライン(第6版)によると、「大弯に浸潤しない腫瘍に対しては脾摘や脾門郭清を行わないことを強く推奨する」と示されています。しかし、Bayes-SHLNMモデルは、患者さんが脾門部リンパ節転移のリスクにさらされているかどうかを再考する機会を提供しています。図3bは大弯浸潤を伴う進行胃がんの症例ですが、Bayes-SHLNMモデルは脾門部リンパ節転移の可能性は低いという予測をしました。大弯浸潤を伴う進行胃がんに関しては、JGCAガイドラインは「大彎に浸潤する腫瘍に対しては脾摘や脾門郭清を行うことを弱く推奨する」と示されていますが、その実施を再考する機会を提供しています。このようにBayes-SHLNMモデルは、患者さんが脾臓摘出手術を受けるべきかどうかについてのコンセンサスを得るのに役立つことが分かります。
図3 進行胃がん症例に関するBayes-SHLNMモデルによる脾門部リンパ節転移の事後確率分布の例
(a) 大弯浸潤を伴わない進行胃がん_症例の事後確率分布。Bayes-SHLNMモデルは脾門部リンパ節転移の平均確率が0.502(転移有り)という予測をしました。
(b) 大弯浸潤を伴う進行胃がん_症例の事後確率分布。Bayes-SHLNMモデルは脾門部リンパ節転移の平均確率が0.023(転移無し)という予測をしました。
展望
本研究では、脾臓摘出を伴う胃全摘術を受けた上部胃がん患者さん593人のデータを使用して、上部胃がんにおける脾門部リンパ節転移を予測するベイズ主義モデルBayes-SHLNMを開発しました。これは我々が調べた限り、脾門部リンパ節転移の予測にベイズ主義アプローチを用いた機械学習モデルを報告した世界最初の研究となります。本研究の結果、Bayes-SHLNMモデルが上部胃がんにおける脾門部リンパ節郭清を行うべきかどうかの臨床的意思決定に役立つ可能性があることを示唆しております。今後の研究では、事後確率分布の精度を評価し、潜在的なモデルの不適切な指定に対処するために、前向き研究とシミュレーションに基づく分析の両方を行う予定です。これらの分析では、不適切なモデル設定を含むさまざまなシナリオの下で、ベイズ主義アプローチのキャリブレーションを検証して参ります。さらに、外部データセットを使用した検証により、異なる状況における不確実性推定の頑健性について、より深い洞察が得られると考えております。臨床現場におけるベイズ主義アプローチの信頼性と実用性を確保するためには、こうした取り組みが不可欠であると判断しております。その結果、ベイズ主義アプローチによる臨床的意思決定プロセスへの貢献が正しく評価され、個別化精密医療への有望な見通しが示されると考えております。
発表論文
雑誌名 npj Digital Medicine
タイトル Establishment of a machine learning model for predicting splenic hilar lymph node metastasis
著者
Kenichi Ishizu, Satoshi Takahashi (* Corresponding Author), Nobuji Kouno, Ken Takasawa, Katsuji Takeda, Kota Matsui, Masashi Nishino, Tsutomu Hayashi, Yukinori Yamagata, Shigeyuki Matsui, Takaki Yoshikawa, Ryuji Hamamoto (* Corresponding Author)
DOI 10.1038/s41746-025-01480-x
掲載日 2025年2月11日付(オンライン・プレ・リリース)
URL https://www.nature.com/articles/s41746-025-01480-x(外部サイトにリンクします)
研究費
- 内閣府科学技術・イノベーション推進事務局 研究開発とSociety 5.0との橋渡しプログラム(BRIDGE)「医療デジタルツインの発展に資するデジタル医療データバンク構想」(研究総括:浜本隆二)
- 文部科学省 次世代人工知能技術等研究開発拠点形成事業補助金
発表者
国立がん研究センター
研究所
医療AI研究開発分野:石津賢一(筆頭著者)、河野伸次、浜本隆二(責任著者)
中央病院
胃外科:石津賢一(併任・研究当時)、西野将司、林勉、山形幸徳、吉川貴己
理化学研究所革新知能統合研究センター
がん探索医療研究チーム:高橋慧(責任著者)、高澤建、竹田勝児、浜本隆二(併任)
名古屋大学 大学院医学系研究科総合医学専攻
生物統計学分野:松井孝太、松井茂之
用語説明
注1 ベイズロジスティック回帰
ベイズロジスティック回帰とは、ロジスティック回帰にベイズ統計の枠組みを適用した手法です。従来のロジスティック回帰は頻度主義アプローチを取りますが、ベイズロジスティック回帰では、パラメータに事前確率分布を設定し、データを基に事後確率分布を求めるという特徴があります。
注2 脾門部リンパ節転移
脾門部リンパ節転移とは、がん細胞が脾臓の門(脾門)にあるリンパ節に転移することを指します。脾門部は、脾臓に血液を供給する脾動脈や脾静脈が集まる領域であり、多くのリンパ節が存在します。胃がんのリンパ流は、胃大弯側から脾門部へ流れる経路があり、特に胃の上部(噴門部・胃体部) に発生したがんで脾門部リンパ節転移が起こりやすいという特徴があります。進行胃がんでは、脾門部リンパ節が転移の好発部位となるため、D2郭清(リンパ節の広範な切除)が必要になることがあります。
注3 頻度主義アプローチ
頻度主義アプローチとは、統計学の考え方の一つであり、確率を「長期的な頻度」として定義し、推論を行う方法です。このアプローチは「データを何度も観測した場合に、特定の事象が発生する割合」 に基づいております。パラメータの扱いは固定値で、仮設検定を行う際に、帰無仮説(H0)を設定し、それを棄却するどうかを決定します。一般的にp < 0.05 (5%)ならば、「帰無仮説を棄却し、対立仮説を支持する」とします。
注4 ベイズ主義アプローチ
ベイズ主義アプローチとは、確率を「不確実性の度合い」として捉え、データと事前情報を統合して推論する手法です。ベイズの定理を基盤とし、事前確率分布と尤度を組み合わせて、事後確率分布を求めることで、推論を行います。パラメータの扱いは確率分布を持ち(事前分布→事後分布)、仮設検定としては事後確率を用います。頻度主義アプローチによる推定では1つの推定値を得るのに対し、ベイズ主義アプローチでは「確率分布」として推定を行い、不確実性も考慮できます。
注5 ランダム化比較臨床試験(RCT)
ランダム化比較臨床試験(RCT: Randomized Controlled Trial) とは、新しい治療や薬の有効性・安全性を評価するために、被験者を無作為(ランダム)に割り付けて比較する臨床試験のことです。RCTは医学研究の中で最も信頼性の高いエビデンスを提供する試験デザインとされており、因果関係を厳密に評価するためのゴールドスタンダードとみなされています。
注6 5分割交差検証(5fCV)
5分割交差検証(5fCV: 5-fold Cross-Validation) とは、データセットを 5つの等しいサブセット(folds)に分割し、それぞれをテストデータとしたときのモデルの性能を評価する方法です。これは、モデルの過学習を防ぎ、より安定した評価を行うために用いられます。一般的な交差検証(Cross-Validation, CV) の一種であり、5分割はよく使われる標準的な設定の1つです。
注7 受信者動作特性曲線下面積(ROC-AUC)
受信者動作特性曲線下面積(ROC-AUC)とは、分類モデルの性能を評価する指標の一つであり、ROC曲線の下の面積(AUC値)を用いてモデルの識別能力を測るものです。ROC(Receiver Operating Characteristic)曲線とは、異なる閾値での真陽性率(TPR)と偽陽性率(FPR) をプロットしたものを指し、AUC(Area Under Curve)とはROC曲線の下の面積のことを指します(値は0.0 ~ 1.0 の範囲)。AUCの値が大きいほど、モデルが正しくクラスを識別する能力が高いことを意味します。
注8 大弯浸潤(GCI)
大弯浸潤(大弯浸潤: Greater Curvature Invasion)とは、胃がんが胃の大弯側(大きく湾曲している側)に広がっている状態を指します。胃は大きく 「大弯」 と 「小弯」 の2つの湾曲部分に分かれますが、がんが大弯側に浸潤すると、胃の壁を越えて周囲の組織やリンパ節へ広がるリスクが高まります。
お問い合わせ先
研究に関するお問合せ
国立がん研究センター研究所
医療AI研究開発分野 分野長 浜本 隆二
国立がん研究センター中央病院
胃外科 科長 吉川 貴己
理化学研究所 革新知能統合研究センター がん探索医療研究チーム
上級研究員 高橋 慧
名古屋大学 大学院医学系研究科総合医学専攻 生物統計学分野
講師 松井 孝太
広報窓口
国立がん研究センター
企画戦略局 広報企画室
理化学研究所 広報室 報道担当
名古屋大学 医学部・医学系研究科 総務課総務係
関連ファイル
上部胃がんにおける脾門部リンパ節転移を予測する機械学習モデルの開発 ベイズ主義アプローチに基づく臨床的意思決定支援システムを開発(PDF:984KB)