画像認識AIは、患者と医師の良きパートナーになる【日本メディカルAI学会レポート第2弾】

AIはすでに、様々な産業の垣根を超えて活用され始めています。この先のAI応用に関する議論の場は、産業ごとに細分化していくことでしょう。「AI」という軸ではなく「産業」の軸で、幅広い専門性を持った人々が集まり、産業内でAIをどう取り入れていくべきかについて議論が進められていくでしょう。

「日本メディカルAI学会」は、医療分野でのAI応用に特化した学会であり、日本における”産業特化型AI学会”の先駆け的存在です。アイブン編集部は、2020年1月31日~2月1日に東京ビッグサイトTFTホールで行われた、第2回日本メディカルAI学会学術集会に取材参加してまいりました。数々の発表が行われていた中で、編集部が特に興味深いと感じたシンポジウムについて、レポート形式で読者の皆様に共有したいと思います!(全3回)

第2弾のテーマは、”画像診断とAI”です。

※第1弾の記事はこちら
▷ 病気研究がAIで加速、個人に合わせた医療の実現をめざして

良質なデータベースの構築が、皮膚診断AIを発展させる

一人目の登壇者は、山崎研志先生(東北大学大学院医学系研究科皮膚科学)で、AIを用いた皮膚疾患治療に向けての取り組みについて発表しました。

研究背景

皮膚は見た目に関わるだけでなく、感覚や免疫をつかさどる器官であり、健康全体や生活の質に直結します。病院に足を運ぶ人の20%が皮膚疾患であると言われていますが、皮膚の診療にはまだまだ課題が残されています。

たとえば、ホームドクターに適切な診療科を案内される北欧などとは異なり、日本は自由診療であるため、適切な診療科を患者自身が選択するのは容易ではありません。また、東北地方などでは医師の数に対して患者の数が多すぎる、幅広い皮膚疾患の全てに適切な対応をするために医師向けの診断補助ツールが必要とされている、などといった課題もあります。こうした課題をクリアし、患者一人一人への適切な治療をサポートする存在として、AIに期待が集まっています。

山崎先生は、良質な診断基準に基づくAI開発のための画像データベース構築、および治療支援ツールの開発に取り組んでいます。

研究概要

山崎先生はまず、皮膚疾患画像データベースについて紹介しました。インターネット上には皮膚トラブルに関する真偽の不明な情報が多く出回っていますが、診療現場で用いる支援AIは、医学的に正しい情報をもとに構築される必要があります。

そこで、日本皮膚科学会のチームは、全国の大学病院に集積されている皮膚疾患画像を集めたデータベース「National Skin Disease Database」の構築を開始しました。2000近くあるすべての皮膚疾患についての画像(臨床画像、ダーモスコピー写真、皮膚病理写真)を一つのデータベースに集積させることを目的としています。現在までに924の疾患画像が収集できており、今後も協力大学を増やすことで、データ数を倍増させていく予定です。

また、山崎先生と志藤光介先生らの東北大学皮膚科教室では、データベース構築を支援するツールの開発も行っています。AIに皮膚画像を学習させるには、その画像がどの疾患の画像であるかの情報を画像に付与させる必要があります。この付与作業は「アノテーション」と呼ばれており、時間を要するものです。そこで、持ち運び可能で、すきま時間にアノテーション作業ができるようなアノテーション支援ツール「DermAnno」を開発しました。

さらに、東北大学皮膚科教室で開発した治療・診断支援ツールについても紹介します。アトピー性皮膚炎治療支援ツール「A-DAI」は、患者がアプリで顔写真を撮影すると、アプリは皮膚状態の重症度を判定し、塗るべき薬を指示してくれます。治療継続のモチベーション維持や、来院してない期間の患者の状態を把握する役割を果たします。

他にも、手のひらや足の裏に水ぶくれができる「掌蹠膿疱症」の皮膚状態を正確に分類する支援ツール「PPP-AI」や、病理画像から細胞の種類や分布を判断し、診断を支援する「Deep Ackerman」などのツールを開発されているといいます。これらのツールは、医師と患者の時間の増加や、前向きな治療継続、ひいては生活の質の向上に役立っていくことでしょう。

厳密な精度が求められる、病理画像の診断AI

二人目の登壇者は、前田一郎先生(北里大学北里研究所病院・病理診療科)で、乳腺の病理診断の概要の説明や、まだ現在進行中の研究についての発表を行いました。

研究背景

乳がん検査でしこりやがんが見つかった場合には、乳房内の細胞や組織を採取して顕微鏡で観察する「病理検査」が行われます。しかし、病理検査を行うことのできる病理専門医は日本に2539人しかおらず、そのうち乳腺を専門とする医師は数十人と、かなり少ない状況です。このため、病理検査を補佐するAIが求められています。

病理検査には、乳房に細い針を刺して取り出した細胞や組織を検査する「細胞診」と「組織診」があります。取り出した細胞や組織を顕微鏡で観察するためには、プレパラートに載せた標本として加工しなければなりません。細胞診の標本は、「リキッドベースドサイトロジー(LBC)法」という最新技術の登場で、どの医師が作っても均一に作れるようになりました。しかし、組織診の標本は、施設や製作者による差が激しいという課題があります。

組織診の標本は、ホルマリンで固定し、5mm~1cm程度に切り出し、ろうそくの成分(パラフィン)へ埋め込み、パラフィンをさらに4μm程度に薄くし、プレパラートに載せ、染色をする、という手順で行われます。ホルマリンでの固定時間の違いや、薄く切り出す際のわずかな誤差、染色時間の違いなどによって、標本の質にずれが生じてしまうのです。

病理診断AIは、こうしたバラバラの標本から得られる画像から、精度の高い診断を行わなければなりません。さらに、病理検査の結果は、その後に行われる手術検査の結果と一致していなければ訴訟になるほど、慎重に判断されるべきものです。このため、画像認識の精度に妥協は許されません。

研究概要

前田先生は、こうした状況の中、細胞診画像をAIに「弱教師あり学習」させ、画像から、細胞が良性・悪性のいずれであるかを判定させることを試みました。ここで言う弱教師あり学習とは、スライド単位で良性・悪性のどちらかであるという情報のみを付与し、スライド内に無数に存在する細胞単位の良性・悪性については情報を付与しない方法のことです。どのような細胞があると良性または悪性であるのかについては、AI自身が特徴を見つけ出します。

まだ開発中とのことですが、複数の顕微鏡倍率で撮影した画像と年齢を組み合わせることで、高精度で良性・悪性を分類することができたといいます。

ただし、AIが良性と判断した画像の中に病理専門医は悪性と判断する特徴が含まれているといった場合もありました。AIが独自に見つけた判断軸に加え、人間の病理医の判断を学習させるかどうかは、過学習への懸念から、今後も議論を重ねるべき点でしょう。

前田先生は、「AIは優秀だが、AIは間違えても僕は絶対に間違えないものもある」と語った上で、AIと病理医が良きパートナーとして上手く付き合っていくあり方を提唱しました。

人間の医師とAIの診断根拠の違いを解明

三人目の登壇者は、赤塚純先生(日本医科大学・泌尿器科)です。泌尿器科医である赤塚先生は、MRI画像上のがんに対する、AI(ディープラーニング)と人間である専門医の着眼点の違いについて発表しました。

研究背景

前立腺がんは高齢男性に多い病気で、2019年の罹患者数は78500人、死亡者は12600人にも及びます。前立腺がんの有無はまず、検診や人間ドックで「PSA」という前立腺からの分泌物を測定することで判断されます。PSAの測定値が高いと、さらに詳しい画像検査を受ける必要が出てきます。

前立腺がんの画像診断ではMRIが使われますが、高齢化に伴う検査数の増加や治療の細分化に対応していくために、AIによる診断補助が期待されています。しかし、実際の医療で安心して使用するためには、AIが何を根拠に結果をだしているか、人間の医師とどのように違うのかを明らかにすることが求められていました。赤塚先生は、AIの可視化モデルと放射線科医と病理医の診断を用いて、MRI画像上のがんに対するAIと人間である専門医の着眼点の違いについて検証しました。さらに、今後の医療AIでは、AIがどのように判断したかを人間が理解できる形で説明できる必要があると語りました。

研究概要

まず最初に,赤塚先生は、307枚の骨盤MRI画像から前立腺部位を抽出したものについて、畳み込みニューラルネットワーク(CNN)で画像分類を行い、分類精度の指標となるAUCが0.90となる、高精度のAIを構築しました。

次に、赤塚先生は、AIが特徴抽出に用いた部位が、放射線科医と病理医の判断と同じであるか、または異なるかについて調べました。その際、重要領域を可視化する深層学習アルゴリズムをMRI画像に適応し、AIと人間である専門医の分類根拠を比較しました。ご講演の中では下記のパターン毎にMRI画像と病理画像を提示し、その医学的な特徴を説明されました。

1.AIの重要視した領域が、放射線科医・病理医の指摘した領域に含まれていた
これは、AIと人間の医師が、画像の同じ部位に注目し、がんと分類したことを意味します。

2.AIの重要視した領域が、放射線科医・病理医の指摘した領域に含まれていなかった
これは、AIと人間の医師が、異なる部位に注目し、がんと分類したことを意味します。

結果として、放射線科医とAIの判断根拠の一致率は70.5%、病理医とAIの判断根拠の一致率は72.1%となりました。赤塚先生の研究は、AIが医師と同様の画像診断を行う場合でも判断根拠が異なる場合があることを明確に示した、今後の医療AIに示唆を与える重要な研究だと言えるでしょう。

AIが新たな診断基準を見つけ、医学を進歩させる

最後の登壇者は、山本陽一朗先生(理化学研究所 革新知能統合センター 病理情報学チーム)で、医療AIが医学に進歩をもたらす可能性について、実例を挙げながら発表しました。

研究背景

これまでご紹介してきた通り、ディープラーニングの登場によってAIの画像認識精度が向上し、様々な医療研究に画像認識AIが使われるようになりました。しかし、ディープラーニングの医療応用には次のような課題があります。

・ビッグデータが必要
データ収集や医師のアノテーションには多大な労力を要します。

・ブラックボックス問題
AIの分類根拠を数学的に示すことはできても、医師が直感的に理解できる形で示すのは困難です。

ディープラーニングを用いてAIに学習させる手法には主に、「教師あり学習」「教師なし学習」「強化学習」などがあります。例えば、がんの画像に「がん」、がんではない画像に「正常」などとアノテーションされたデータを学習させるやり方は、教師あり学習に相当します。教師あり学習を用いることで、人間の医師の診断方法を覚え、診断や治療を補助してくれるAIを作ることができます。しかし、別の見方をすると、教師あり学習による診断支援は、

・既存の医学の基準を超えた分類はできない

とも言えます。医学の発展は、分類と共にあります。病名や悪性度、正常と異常など、分類に基づいて状態の把握や治療方針の決定を行うことができます。AIが既存の医学分類にはない新たな分類を見つけることができれば、それはブレイクスルーとなります。

これらの課題に対し、山本先生の研究グループは、教師なし学習をベースとした手法を開発することにより、AIによるがんの未知なる特徴の発見を試みました。

研究概要

山本先生の研究グループは、教師なし深層学習を複数組み合わせた新手法を用いて、病理画像から前立腺がんの未知なる特徴の発見を試みました。病理画像は100億画素を超える非常に複雑なデータであり、多くの情報を含んでいます。この画像を独自に学習させ、AIが病理画像から獲得した特徴を、前立腺がんの世界的ゴールドスタンダードである「グリソンスコア」と照らし合わせました。グリソンスコアとは、1950年代に作られた、病理画像から前立腺がんの悪性度を判断するための5段階の指標です。

結果、AIはグリソンスコアで定義されている画像の特徴を独自に見つけ出しただけでなく、グリソンスコアには含まれていない「間質」というがんから離れた部位の特徴を見つけ出すことができました。間質の状態によってがんの再発率が変化するという新しい法則性を見つけたのです。

この新しい法則が実際に使えるものであるかを、日本医科大学病院で集められたデータに適用してみたところ、再発予測精度を示す指標(AUC)は、医師がグリソンスコアを用いた時0.744、一方で、AIが新たに見つけた基準を用いた時0.820となりました。さらに、AIの判断と人間の医師の判断を組み合わせたところ、AUCは最大0.845となり、AIと人間が協力することにより、最も精度高く予測することができることがわかりました。また、今回AIが見つけた基準は、他の地域の大学病院のデータでも同じ精度で使用できることがわかりました。

このようにAIが病気の新基準の発見に貢献することにより、新たな治療法へつながる可能性があります。さらに、AIと医師が協力することで精度が向上したという点にも注目です。AIが医師の仕事を失くすのではなく、AIと医師が良きパートナーとして協力し合うことで、より良い医療の実現に近づいていくことでしょう。

連載「日本メディカルAI学会2020 レポート特集」(全3回)
第1弾 病気研究がAIで加速、個人に合わせた医療の実現をめざして
第2弾 画像認識AIは、患者と医師の良きパートナーになる
第3弾 「AIの目」が人間のミス発生を防ぐ!安全な手術を支援するAIシステム

業界から探す

PAGE TOP