理化学研究所(理研)光量子工学研究センター眼疾患クラウド診断融合連携研究チームの秋葉正博チームリーダー、横田秀夫副チームリーダー(同センター画像情報処理研究チームリーダー)、安光州客員研究員、東北大学大学院医学系研究科眼科学教室の中澤徹教授らの共同研究グループ※は、眼底検査[1]装置からのマルチモダリティ画像情報[2]を用いて、緑内障を自動診断できる機械学習[3]モデルを構築しました。
本研究成果は今後、各症例に対して機械学習モデルによる確信度[4]を提示することで、緑内障の早期発見につながると期待できます。
緑内障は自覚性がなく、一度失った視野や視力を治療によって取り戻すことができないため、眼科検診による早期発見と早期治療が求められています。従来の緑内障の診断は、カラー眼底画像や光干渉断層計(OCT)[5]画像の読影による主観的判断に基づいていたため、客観性がありませんでした。
今回、共同研究グループは、緑内障208眼と健常149眼について、眼底検査装置を用いて撮影された視神経乳頭[6]と黄斑[7]のデータ(カラー眼底画像1種とOCT画像4種)からそれぞれマルチモダリティ画像情報を抽出しました。そしてこれらの情報に対して、転移学習[8]とランダムフォレスト[9]を組み合わせることにより、少数の情報から緑内障の自動診断を行う機械学習モデルを構築し、非常に高い診断精度(AUC[10]=0.963)を得ることに成功しました。
本研究成果は、英国の科学雑誌『Journal of Healthcare Engineering』のオンライン版(2月18日付け)に掲載されました。
※共同研究グループ
理化学研究所 光量子工学研究センター
眼疾患クラウド診断融合連携研究チーム
チームリーダー 秋葉 正博(あきば まさひろ)
副チームリーダー 横田 秀夫(よこた ひでお)
(光量子工学研究センター 画像情報処理研究チーム チームリーダー)
客員研究員 安 光州(アン・コウシュウ)
東北大学
大学院医学系研究科 眼科学教室
教授 中澤 徹(なかざわ とおる)
助教 面高 宗子(おもだか かずこ)
助教 津田 聡(つだ さとる)
医員 志賀 由己浩(しが ゆきひろ)
医員 高田 菜生子(たかだ なおこ)
医員 橋本 和樹(はしもと かずき)
株式会社トプコン R&D本部
シニアーエキスパート 木川 勉(きかわ つとむ)
株式会社トプコンと理化学研究所による共同研究は、理化学研究所が推進する産業界のニーズを重要視した連携活動「産業界との融合的連携研究制度」の一環として、共同研究開発チーム(眼疾患クラウド診断融合連携研究チーム)を設置することで連携を促進したものです。
背景
緑内障は、高眼圧、網膜への血流量低下などのさまざまな危険因子により、視神経が損傷を受け、やがて失明に至る疾患で、日本では中途失明原因の第1位となっています注1)。
緑内障は自覚性がなく、一度失った視野や視力を治療によって取り戻すことができないため、眼科検診により早期発見し、その進行を止める早期治療を行うことが求められています。従来の緑内障の診断は、カラー眼底画像や眼底の2次元断面を測定する光干渉断層計(OCT)画像で、視神経乳頭と黄斑の形状に対する読影を行うことにより主観的に判断されていたことから、客観性がありませんでした。
一方、機械学習による眼科疾患検出においては、大量の眼底写真から糖尿病網膜症の自動診断システムがアメリカ食品医薬局(FDA)で認可されるなど、世界的に大きな進展があります。しかし、緑内障を対象とするマルチモダリティ画像情報を大量に収集することは難しく、緑内障の詳しい診断はできませんでした。
そこで共同研究グループは、眼底検査装置で視神経乳頭と黄斑を撮影したデータから抽出したマルチモダリティ画像情報に対して、緑内障の自動診断を行う機械学習モデルの構築を試みました(図1)。
注1)日本眼科学会ホームページ
研究手法と成果
共同研究グループはまず、確定診断付きの緑内障208眼(MD値[11]:-3.90±3.80dB[11])と健常149眼(MD値:-0.21±1.15dB)の合計357眼を対象とし、それぞれから視神経乳頭部のカラー眼底写真(RGB画像中のグリーン成分のみ)、3次元OCTデータから得られる視神経乳頭神経線維層[6]の層厚マップとデビエーションマップ[12]、同じく3次元OCTデータから得られる黄斑の神経節細胞複合体層[7]の層厚マップとデビエーションマップの5種類を抽出しました(図2)。なお、デビエーションマップは、正常眼データベースから算出した層厚マップの平均画像との差分画像のことです。
次に、公開された訓練済みの畳み込みニューラルネットワーク(CNN)[13]モデルの一種であるVGG19[14]モデルを用いて、上記5種類の画像データセットでそれぞれのVGG19モデルを構築しました(転移学習)。CNNには一般的に特徴量抽出部と分類部があり、訓練によって両者ともに自動的に学習されます。そして、それらのVGG19モデルの特徴抽出部から緑内障と正常を分類するのに必要な特徴量を抽出した後、ランダムフォレストにより学習させ、緑内障の自動診断を行う機械学習モデルを構築しました。
最後に、構築した機械学習モデルの性能を調べるために、10-分割交差検証法[15]により各種画像の組み合わせを検証しました。その結果、最高性能としてAUC=0.963を示す高い診断精度を得ることができました。
今後の期待
今回、緑内障患者の眼底検査装置による測定結果のマルチモダリティ画像情報を用いて、転移学習とランダムフォレストを組み合わせることにより10-分割交差検証法で0.963のAUCを示す結果を得ることができました。
本成果は、各症例に対して提案した機械学習モデルにより、緑内障の確信度を提示することで、緑内障の早期発見につながると期待できます。
原論文情報
- Guangzhou An, Kazuko Omodaka, Kazuki Hashimoto, Satoru Tsuda, Yukihiro Shiga, Naoko Takada, Tsutomu Kikawa, Hideo Yokota, Masahiro Akiba, and Toru Nakazawa, "Glaucoma Diagnosis with Machine Learning Based on Optical Coherence Tomography and Color Fundus Images", Journal of Healthcare Engineering, 10.1155/2019/4061313
発表者
理化学研究所
光量子工学研究センター 眼疾患クラウド診断融合連携研究チーム
チームリーダー 秋葉 正博(あきば まさひろ)
副チームリーダー 横田 秀夫(よこた ひでお)
(光量子工学研究センター 画像情報処理研究チーム チームリーダー)
客員研究員 安 光州(アン・コウシュウ)
東北大学 大学院医学系研究科 眼科学教室
教授 中澤 徹(なかざわ とおる)
報道担当
理化学研究所 広報室 報道担当
Tel: 048-467-9272 / Fax: 048-462-4715
お問い合わせフォーム
東北大学 大学院医学系研究科・医学部 広報室
Tel: 022-717-7891 / Fax: 022-717-8187
E-mail:pr-office[at]med.tohoku.ac.jp
※上記の[at]は@に置き換えてください。
産業利用に関するお問い合わせ
補足説明
- 1.眼底検査
視力は網膜の働きにより得られる。眼底検査とは、眼科計測装置によって、瞳孔を通して網膜を撮影し観察すること。 - 2.マルチモダリティ画像情報
複数の異なる装置で撮影した画像データ。 - 3.機械学習
人間の学習能力と同様に、機械(コンピュータ)に学習能力を持たせる手法。データから機械自身が反復的に解析し、ルールを見つけ出すという特徴がある。 - 4.確信度
機械学習モデルの出力で、各分類結果をスコアリングした数値であり、0から1までの値をとる。値が1に近いほど、機械学習モデルのその分類結果に対して自信を持つことを意味する。 - 5.光干渉断層計(OCT)
光の干渉を用いて、非侵襲的に眼底の2次元断面を測定できる眼科装置。光ビームの2次元走査により、3次元形状の計測ができる。OCTはOptical Coherence Tomographyの略。 - 6.視神経乳頭、神経線維層
視神経乳頭は眼底中心より耳側約15゜の位置にあり、網膜内の全ての視神経繊維が束になり脳へ向かう部位である。神経線維層は、神経節細胞の軸索が集合したもので、その菲薄化は緑内障が疑われる。 - 7.黄斑、神経節細胞複合体層
黄斑は網膜の中心部分であり、色や形を識別する視細胞がたくさん集まっている部位である。神経節細胞複合体層は、網膜の10層構造中、網膜神経線維層、神経節細胞層、内網状層からなり、その菲薄化は緑内障が疑われる。 - 8.転移学習
すでにある領域で構築済のモデルを他の領域で適用させる技術。新しいデータセットを用いて、モデルを再構築する必要がある。 - 9.ランダムフォレスト
決定木を弱分類器として集団学習を行うアルゴリズムであり、説明変数が多い場合によく使われる方法である。 - 10.AUC
受信者動作特性曲線より下の部分の面積をAUCといい、0から1までの値をとるが、値が1に近いほど判別性能が高いことを示す。機械学習モデルの分類性能を評価するのによく使わる指標の一つである。AUCはArea Under the Curveの略。 - 11.MD値、dB
視野測定結果の一つとしてMD値があり、dBという単位で定量的に評価されており、同じ年齢の正常者と比較して、視野の欠け具合を表したものである。正常が0dBでマイナスになるほど、視野が欠けていることを表している。 - 12.デビエーションマップ
OCT装置メーカーにより提供された正常眼データベースから算出した、層厚マップの平均画像との差分画像。 - 13.畳み込みニューラルネットワーク(CNN)
視覚野の機能からヒントを得た、ニューラルネットワークの派生版であり、主に画像分析に利用されている機械学習手法の一つである。従来の機械学習と比べて、自動的に画像から有用な特徴を抽出することが可能な特徴抽出部がある。 - 14.VGG19
コンピュータビジョンの業界において、毎年ImageNetというコンテストが開催され、各チームは訓練済のCNNモデルを公開する。VGG19はSimonyan氏によって提案されたCNN構造である。 - 15.10-分割交差検証法
n-分割交差検証で、nを10に設定したケース。n-分割交差検証では、標本群をn個に分割し、そのうちの一つをテスト群とし、残りのn-1個の群で機械学習モデルを構築する。それぞれのテスト群で検証したn回の結果を平均して、機械学習モデルの評価を行うことが機械学習分野でよく用いられる。
図1 視神経乳頭と黄斑
黄斑は網膜の中心部分であり、色や形を識別する視細胞がたくさん集まっている部位である。視神経乳頭は眼底中心より耳側約15゜の位置にあり、網膜内の全ての視神経繊維が束になり脳へ向かう部位である。
図2 5種類の入力画像のサンプル(緑内障眼)
(a)カラー眼底写真(RGB画像中のグリーン成分のみ)、(b)視神経乳頭神経線維層の層厚マップ、(c)視神経乳頭神経線維層のデビエーションマップ、(d)黄斑の神経節細胞複合体の層厚マップ、(e)黄斑の神経節細胞複合体のデビエーションマップ。