「医療の問題を、工学的に解決したい」と話す竹本 智子 研究員は、診断が難しい早期胃がんをAIによって高精度に診断できる技術を開発しました。検査する医師や施設が違っても正確に早期胃がんを見つけられるように、専門医たちと連携して実現した技術です。
竹本 智子(タケモト・サトコ)
発見が難しい早期胃がん
国内の胃がんの罹患数(2019年)、死亡数(2021年)は、ともに全がんのなかで第3位と、日本人がかかるがんの中でも常に上位にある。早期発見できれば5年生存率が95%と予後の良いがんだが、初期は自覚症状がほとんどないため発見が遅れ、進行してから見つかることが少なくない。そのため、直近のデータとして公表されている2009年から2011年における胃がんの5年生存率は約66%となっている。
近年では、バリウムを飲んで行うX線検査より発見率の高い胃内視鏡(胃カメラ)検査が主流となりつつある。しかし、胃がんは早期であるほど色や表面の形状などの形態的特徴が乏しく、胃潰瘍や胃炎との区別がつきにくい。加えて、使用する診断機器の性能によっても発見率は異なるため、診断スキルの高い医師や高性能機器が揃っている大規模病院と、そうではない小規模病院では、早期胃がんの発見率、ひいてはその後の生存率にも差が出てしまうのが現状だ。
「『この状況をなんとかしたい』と言う現場の医師たちと話し合う中で、AIで正確に早期胃がんを発見できるのではないかと考えました。AI技術のなかでも画像認識を得意とする機械学習という手法を用いることで、内視鏡画像から早期胃がんを自動的に検出する。これが実現すれば、集団検診で大量の内視鏡画像を診断する際にスクリーニングを行い、医師や施設による検出精度の差をなくすことができます」
300枚の正解データを113万枚に増幅
画像診断ができるAIをつくるには、機械学習のために通常は数十万枚、数百万枚という膨大な量の「正解データ」が必要になる。ところが、竹本 研究員らが構築したAIにおいて、教え込んだ画像は「がん画像」150枚と、がんが写っていない「正常画像」150枚の計300枚のみ。しかも、特徴的な症例だけを任意に選んだのではなく、国立がん研究センター東病院で約1年間に行われた手術68症例からランダムに抽出した画像を使っている。
「この手法がうまくいった要因の一つは、正解データが極めて正確だったことです。正解データを用意した医師が診断AIに詳しく、診断精度を上げるにはどうすればよいかを理解した上で、画像中に病理診断でがん領域だと確定しているところにラインを引き、正誤を教えるラベル付けなどの作業を根気強くやってくれたお陰です」
どんなに正確な画像でも、300枚だけでは診断AIはつくれない。そこで竹本 研究員は、300枚の画像から局所画像を切り出して5.5万枚に増やした。さらに、それらの画像を回転させたり反転させたりして計113万枚まで増やした上で、早期胃がんの表面形状や色調などの細かな画像の特徴を学習できるようにした(図1)。
図1 学習用データの生成
がん画像150枚、正常画像150枚の計300枚から機械学習用データを生成するため、がん画像から、がん領域を80%以上含む局所画像(224×224ピクセル)をランダムに切り出して2.6万枚生成した。同様に、正常画像の局所画像(224×224ピクセル)を2.9万枚生成して、計5.5万枚に増やした。
生成した正解データを入力し、画像データから特徴などを自ら抽出して学習する「畳み込みニューラルネットワーク(CNN)」という手法を用いて学習したことで、AIは一気に精度を上げた。これで画像からがんの有無を判定できるようになったわけだが、竹本 研究員はさらに一歩先の「がんの範囲を診断する(範囲診断)」に挑んだ。
学習に使った画像データを約1,600個のブロックに分割し、学習済みのCNNに再度入力してブロックごとにがんか正常かを予測させたのだ。その上で元の画像に重ね合わせることで、1ピクセルごとの高精度ながんの範囲診断ができるようになった。
専門医の診断と比較しても遜色なし
構築したAIが正しく範囲診断できるのか、新たながん画像462枚、正常画像396枚を用意して評価したところ、正解率はがん画像(陽性的中率)で83.8%、正常画像(陰性的中率)で77.5%と高かった。さらに、内視鏡検査後の病理診断の結果を踏まえて専門医が作成した極めて正確な範囲診断(正解領域)とAIが予測したがん領域(予測領域)の比較でも、両者の重なり具合を示す指標IoU(Intersection over Union)としては高値の66.5%を示した(図2)。
「IoUはかなりシビアな指標で、全体的に一致していても、わずかなズレで30%くらい下がってしまうため、70%や60%でも高値なのです。しかし、今回の研究はできるだけ早く医療現場で実用化したいと考えているので、あえて厳しい基準による数値を包み隠さず出しました」
図2 内視鏡専門医の診断範囲とAIによる診断範囲の比較
代表的な早期胃がんの三つのタイプについてAIで範囲診断した結果を重ねてみると、内視鏡専門医による正解とほぼ予測範囲が一致した。
AIが評価したものと同じ画像を6名の内視鏡専門医による評価と比較した結果、AIの診断能力は専門医とほぼ同等であることが示された。早期胃がんは粘膜表面に明らかな病変を認められないことが多く、だからこそ診断が難しいのだが、専門医は多くの症例を見てきた経験からわずかな血管の走行などを頼りに早期胃がんを判断している。研究に参加した専門医によれば、このAIも血管が集中している方向などを学習した上で早期がんを見分けている可能性があるという。
希少がん診断や教育への応用を目指して
いずれは内視鏡検査装置に内蔵されているコンピュータにこのAIを組み込み、医師や施設による検出精度の差をなくすことへのサポートを目指している。また、少ない正解データで学習できる強みを生かして、症例数が少なく正解データをつくりにくい希少がんでも学習させることができるほか、若手医師の教育への活用も期待できる。
「本当は医師になりたかった」と言う竹本 研究員。情報系研究者として医工連携研究に携わるようになり、医療に関わる研究の難しさとともに面白さを実感しているという。「情報系というと、アルゴリズムの高速化など、コンピュータの性能を上げることに熱心な研究者をイメージするかもしれませんが、私が興味を持っているのは自然や生命です。人が病気になる原因を探ったり、医療の問題を解決するなど、明確な目標を持って医工連携研究を続けていきます」
(取材・構成:牛島 美笛/撮影:相澤 正。/制作協力:サイテック・コミュニケーションズ)
関連リンク
- 2023年6月6日プレスリリース「AIで早期胃がんの範囲診断が可能に-内視鏡専門医の診断精度に迫る-」
この記事の評価を5段階でご回答ください