外科医の手術技能評価をAIによる画像認識スコアで達成~JAMA Surgeryに論文発表~

ad

2023-06-19 国立がん研究センター

発表のポイント

  • エキスパートによる腹腔鏡手術*1(腹腔鏡下大腸切除術)60症例の映像を学習したAIによる手術技能評価モデルを開発しました。
  • AIが手術画像を認識し、エキスパート手術との類似度を画像認識スコアとして判定しました。開発で用いた映像とは別の手術映像を用いて画像認識スコアを算出した結果、日本内視鏡外科学会技術認定制度*2の審査員が評価した審査スコアと強い相関を認めました。
  • 本結果は、AIによる手術技能評価モデルを用いた、より客観的で効率的な技能評価が可能となることが期待されます。
  • 今後、学会による技術認定審査の補助や、他臓器の腹腔鏡手術へ応用可能な幅広い手術技能評価システムとしての実用化を目指します。

概要

国立研究開発法人国立がん研究センター(理事長:中釜 斉、東京都中央区)東病院(病院長:大津 敦、千葉県柏市)医療機器開発推進部門の伊藤雅昭部門長の研究グループは、一般社団法人日本内視鏡外科学会(以下、日本内視鏡外科学会)と連携し、エキスパートが実施した腹腔鏡下大腸(S状結腸)切除術60症例の手術映像を用い、AIが手術工程を自動認識するモデルを開発しました。技術認定制度の審査結果が紐付けられた別の手術映像を用い、本モデルによる評価を行ったところ、AIによる画像認識スコア(AIが判定するエキスパート手術との類似度)が、日本内視鏡外科学会の選定した審査員による技術認定制度審査スコアと強い相関を認めました。

本研究は、手術映像やそこに映る対象物をAIによって画像認識し、手術中の外科医のパフォーマンスや事象を客観化・定量化することにもつながり得る、極めて新しい試みです。AIによる手術技能評価モデルの開発は、より客観的な評価を可能とするとともに、評価者の負担を軽減することで、外科手術教育の質と効率性を高めることが期待されます。学会による技術認定制度の審査補助や、他の腹腔鏡手術を含めた幅広い自動手術技能評価システムとして実用化を目指します。

本研究の成果は、米国学術雑誌「JAMA Surgery」で発表(日本時間2023年6月7日付)されました。

背景

外科医の手術技能は、患者さんの臨床経過や予後を左右する重要な要素です。これまでたくさんの手術技能評価に関する研究・開発が行われてきましたが、最もよく実施されているのは熟練外科医が手術や手術動画を見ながら評価を行う古典的な方法です。この方法では、評価者の労力と膨大な時間が必要で、また個人の評価に頼るため主観性が排除しきれず、トレーニングや技能向上にも活かしづらいという課題があります。そこで、より客観的で効率的な手術技能評価の方法を構築することが求められています。

近年、AI、特に深層学習は、診断や意思決定などを支援することで、診療に大いに貢献する可能性が期待されています。AIは、写真や映像の中の対象物の特徴を学び、新しいデータに対して予測を行い、それを識別、検出、分類します。手術映像やそこに映る対象物をAIにより画像認識することは、手術中の外科医のパフォーマンスや事象を客観化・定量化することにもつながり得る、極めて新しい試みです。

本研究チームはこの研究を通じて、AIが熟練外科医の腹腔鏡下大腸切除術における手術工程を認識できるモデルを開発しました。そして、開発したモデルを用いて、手術工程認識の確信度に基づく自動手術技能評価の可能性を検討しました。

研究方法・成果

本研究は、内視鏡外科手術の技能を評価する日本内視鏡外科学会技術認定制度審査で評価された650症例の手術映像を用いました。これらは学会の技術認定審査を受けるために提出されたもので、このうち極めて高いスコアであった60症例の手術映像を、エキスパートによる手術としてAIに学習させ、手術工程を認識するモデルを開発しました。

本モデルは各手術の工程を認識し、それがどの程度信頼できるかを示すAIによる画像認識スコアを算出することで、AIが評価したエキスパート手術との類似度を出力します。本モデルを作成するため、深層学習技術の一種である「Convolutional Neural Network(畳み込みニューラルネットワーク)」を用いました。

性能の検証は、日本内視鏡外科学会の技術認定制度審査結果に基づいて高スコアから低スコアなどの各グループに分けられた、別の60症例の手術映像を用いて行いました。その結果、日本内視鏡外科学会技術認定制度審査の評価スコアと、AIによる画像認識スコアとの間の相関係数は0.81と、極めて強い相関を認めました。
外科医の手術技能評価をAIによる画像認識スコアで達成~JAMA Surgeryに論文発表~

また、技術認定制度審査スコアの高いグループと低いグループを自動的に識別する能力も評価しました。閾値(高スコアと低スコアを識別するための境界値)を設定し、手術映像がどのスコアグループに属するか診断したところ、閾値が0.88のとき、低スコアグループのスクリーニングのための特異度と感度はそれぞれ93.3%と82.2%、低スコアグループのスクリーニングのためのAUROC(the Area Under the Receiver Operation Characteristic)は0.93でした。閾値が0.91のとき、高スコアグループのスクリーニングのための特異度と感度はそれぞれ93.3%と86.7%、高スコアグループのスクリーニングのためのAUROCは0.94でした。
002.png

展望

今回開発したAIモデルが算出した画像認識スコアは、日本内視鏡外科学会技術認定制度審査の評価スコアと強く相関し、本モデルによる自動的な手術技能評価や自動スクリーニングシステムの実現可能性を示しました。本研究の方法論は他の種類の内視鏡手術にも適用可能であるため、引き続き日本内視鏡外科学会と連携し、引き続き複数領域での評価が可能となるよう検討を続けます。

発表論文

雑誌名
JAMA Surgery

タイトル
Automatic Surgical Skill Assessment System based on Concordance of Standardized Surgical Field Development using Artificial Intelligence

著者
Takahiro Igaki, Daichi Kitaguchi, Hiroki Matsuzaki, Kei Nakajima, Shigehiro Kojima, Hiro Hasegawa, Nobuyoshi Takeshita, Yusuke Kinugasa, Masaaki Ito

掲載日
2023年6月7日

DOI
10.1001/jamasurg.2023.1131

URL
https://jamanetwork.com/journals/jamasurgery/fullarticle/2805952?resultClick=1

研究費
  • 国立研究開発法人日本医療研究開発機構  未来医療を実現する医療機器・システム研究開発事業「内視鏡外科手術における暗黙知のデータベース構築と次世代医療機器開発への応用」
  • 国立研究開発法人日本医療研究開発機構  メディカルアーツ研究事業「内視鏡外科手術におけるAI自動技術評価システムの開発」
用語解説

*1 腹腔鏡手術
お腹の臓器の手術において、お腹に開けた複数の小さな穴からカメラや手術器具を入れて、カメラ映像を見ながら行う手術。大きくお腹を切り開いて手術を行う開腹手術よりも、患者さんの負担が少なく、回復までの時間が早いことが特長。開腹手術に代わり、近年増加している。

*2 日本内視鏡外科学会技術認定制度
日本内視鏡外科学会が手術技術の審査(技術認定試験)を行い、各関連領域において内視鏡手術に携わる医師の技術を高い基準にしたがって評価し、後進を指導するにたる所定の基準を満たした者を認定するもの。消化器・一般外科部門の合格率は2~3割程度。

問い合わせ先

研究に関する問い合わせ
国立研究開発法人国立がん研究センター東病院
医療機器開発推進部門 竹下 修由

広報窓口
国立研究開発法人国立がん研究センター
企画戦略局 広報企画室(柏キャンパス)

医療・健康
ad
ad
Follow
ad
タイトルとURLをコピーしました