人種ごとに医療サービスは変えるべき?最新メディカルAI研究5選【週刊】

   

こんにちは。アイブンライターの清野です。

最新研究をサクっとキャッチアップできる「今週の5本」シリーズ。今週のメディカルAI編では、以下の5つの最新AI研究に注目していきます!

バックナンバーはこちら

今週のラインナップ
1. Dynamic PETのノイズ除去に新手法が登場
2. 歯科における機械学習応用の現状
3. U-Netと確率モデルの併用で高精度のセグメンテーションを実現
4. 大規模データで心血管疾患のリスクを評価
5. 医療に潜む人種差別とその影響の大きさ

今回も手術支援AIベンチャーCEOの河野健一医師にコメントをいただきました!

手術支援AI事業を展開している河野先生のiMed TechnologiesはAIエンジニアを募集しています!関心のある方はこの記事の下部をチェック!

Dynamic PETのノイズ除去に新手法が登場

1本目は、PET画像のノイズ除去に関する研究を紹介します。

本研究ではDeep Image Prior(DIP)と呼ばれる手法を用いて、アノテーション作業なくネットワークに学習させ、Dynamic PETのノイズ除去を行う方法を提案しています。

それでは、研究の概要を説明していきます。

背景と課題

畳み込みニューラルネットワークconvolutional neural network: CNN)は、医用画像へ応用されていますが、教師あり学習を行うためには、数多くの医用画像を集めてアノテーションをしなければなりません。

2017年にDeep Image Prior(DIP)と呼ばれる手法が報告されました。その論文では、学習しないにも関わらず(註:恣意的に与えた重みで)、CNNにはノイズ除去、超解像、塗りつぶしなどの標準的なタスクを処理できる能力があることが示唆されました。

アプローチと結果

日本・中央研究所の橋本らは、Dynamic PET(positron emission tomograpy)画像のノイズ除去のため、DIP法を用いました(註: Dynamic PETはStatic PETと比べノイズが多い)。入力データとしてStatic PET画像、ラベルとしてオリジナルのDynamic PETを用いました。そして出力はノイズが除去されたDynamic PET画像です。

本手法から得られた画像は、その他のアルゴリズムと比較してノイズが少なく、より正確なDynamic画像であることが示されました。さらにDIP法では、その他のノイズ除去法よりもコントラスト・ノイズ比に優れ、サンプルサイズを小さくしてもコントラスト・ノイズ比が維持されており、低線量PETにも応用可能であることが示されました。

以上です。学習の際にラベルとして画像そのものを用意することで人為的アノテーション作業を回避した点が興味深いですね。

ソース:Dynamic PET Image Denoising Using Deep Convolutional Neural Networks Without Prior Training Datasets

河野先生(医師兼CEO)のコメント

顔写真などで解像度の低いザラザラした写真やピンぼけの写真をディープラーニングで解像度を上げて綺麗にする超解像という手法をネットニュースなどで見られた方も少なくないと思います。

本研究ではそれと同じようなことをPET画像という医療画像で行っています。PET画像は、例えば転移性腫瘍において、全身のどこに腫瘍が転移しているかを調べるために使用します。

この研究のポイントは、解像度の低い画像と高い画像の両方のデータが揃っていることです。それをディープラーニングで対応付けることにより、「低解像度→高解像度」の変換モデルを作ることができます。

臨床現場で両方の画像が揃っていることは普通ありえません。何故なら高解像度の画像さえあれば良く、両方揃えることは患者さんにも医療者側にも負担がかかるからです。特にPETでは患者さんが被爆しますので、2回も被爆させることはできません。

本研究でどうしているのか確認してみると、人間ではなくサルでPETを行っていました。もちろん、サルでも倫理委員会を通すことが必要ですが、この研究の一番の重要なポイントはそのデータを取得したことです。他の研究施設では簡単には取れないデータを取得することにより、臨床応用において競争優位性となる価値を生み出します。

■関連記事:「目の画像」とAIで心血管疾患を予測する

歯科における機械学習応用の現状

2本目は、歯科領域とAIに関するレビュー論文です。

歯科では、医科に遅れて機械学習技術が導入されます。歯科におけるAIの応用はどのような現状なのでしょうか。

それでは、研究の概要を説明していきます。

背景と課題

ディープラーニング(DL)は医療分野に応用されつつありますが、歯科領域でも同様です。韓国釜山大学歯科研究所のJ. Hwangらは、2016年以降に発表されたDLの歯科応用に関する論文をPubmed、Scopus、IEEEから25本選出し、レビューしました。

アプローチと結果

論文の検索ワードは、「”Deep Learning”もしくは”Neural Network”」と「Dentistry」、そして「”Diagnosis”もしくは”Detection”もしくは”Classification”もしくは”Segmentation”」です。レビュー論文や他分野の論文を除外し、査読つき論文のみを選びました。

その結果、2016年に2報、2017年に9報、2018年に14報の論文が選出されました。訓練データセットの平均は、2016年で600.5件、2017年で175.5件、2018年で1200件で、全てのモデルは畳み込みニューラルネットワーク(CNN)でした。

CNNは2016年に歯科領域で報告されてから、その報告数を増やし続けています。またCNNの構造自体も深く、複雑になる傾向があり、学習の対象も歯牙そのものから歯肉、歯周組織、歯列弓、骨密度など多岐に渡っています。そして、ほとんどの研究でのモデルの精度は90%未満であり、臨床的には許容できない値に留まっています。

以上です。こうしてみると歯科領域でのAIの応用はまだまだ遅れているという印象を受けますね。

ソース:An overview of deep learning in the field of dentistry

河野先生(医師兼CEO)のコメント

歯科領域もAI論文がここ数年で急増していることが分かります。臨床応用される日も近いと思いますが、ここでは、臨床現場で必要とされる精度についてコメントしたいと思います。

臨床現場で必要とされる精度はどのように考えればいいでしょうか? 大雑把に言えば、現場の医師と比較してAIが優れているかどうかです。現状ではAI単独で診断することはほぼなく、医師がAIの結果を加味して最終診断を行います。そのため、医師単独と、医師がそのAIを加味して診断した場合に精度が上がるかどうかが鍵になります。そのため、最近の研究では、医師とAIとの比較結果がよく見られるようになっています。

具体例を挙げると、LPIXEL社が販売しているEIRL ANEURYSMという頭部MRI(MRA)から動脈瘤を検出するソフトでは、添付文書に比較結果が記載されており、医師がソフトを併用したほうが精度が高かったというデータが提示されています。その時の感度・特異度はともに80%以下であり、それでも医師単独よりも良かったということで、医療機器の承認を受け、現在、医療現場で利用されるようになっています。

このように医療現場で使われるために必要な精度は、それぞれの現場における現状と比較することが大切です。

■関連記事:AIが自宅で虫歯チェック!?「注目のAI特許」今週の5本

U-Netと確率モデルの併用で高精度のセグメンテーションを実現

3本目は、CT画像のセグメンテーションに関する研究です。

最近ではフレイルやサルコペニアが話題で、高齢者の筋肉量について注目されるようになっています。どのようにして、より高精度の筋のセグメンテーションを実現したのでしょうか。

それでは、研究の概要を説明していきます。

背景と課題

深層畳み込みニューラルネットワーク(DCNN)は、医用画像に広く応用されており、物体の検出やセグメンテーションにも活用されています。2018年には、推論結果に対して「不確実性」をもつ部位を可視化する技術が提案され、従来の手法よりも高精度を示しました。

これを受け、日本の奈良先端科学技術大学のY. Hiasaらは、U-NetとベイジアンCNNを組み合せた手法を提案しました。

アプローチと結果

使用するデータは大腿のCT画像で、タスクは筋のセグメンテーションです。またデータセットには2種類あり、1つは完全にアノテーションされた20件のCT画像、もう1つは部分的にアノテーションされた18件のCT画像です。

セグメンテーションの評価として、ダイス係数(DC)と平均対称表面距離(average symmetric surfacce distance, ASD)を用いました。ダイス係数は、実際の筋(Ground Truth)と推定の筋の重なった割合を表します。ASDは、実際の筋の輪郭と推測された輪郭との距離から算出されます。

その結果、DCは0.89 ± 0.016で、ASDは0.994 ± 0.23mmでした(註: 9割重なって、ズレても1mm程度ということ)。この結果により、当時最先端であったマルチアトラス法と比較して有意に改善していることが示されました。また、不確かさの部分が多い画像とセグメンテーションの失敗には相関関係あることも示されました。

以上です。ベイジアンCNNを使うことによって、推論を確率的に評価し、セグメンテーションの精度を向上させた事例ですね。

ソース:Automated Muscle Segmentation from Clinical CT Using Bayesian U-Net for Personalized Musculoskeletal Modeling

河野先生(医師兼CEO)のコメント

ここでは論文の本質からずれますが、CT画像から筋肉量を定量的に測定するということについて考えてみましょう。

医師はCT画像を見ればどこが筋肉か分かりますが、例えば胸部・腹部のCT画像の枚数は数十枚〜数百枚になりますので、1枚1枚筋肉の輪郭を囲っていたら1人分で1時間以上かかると思います。そのため、今までは筋肉量を測定することはありませんでした。

今後、筋肉量が自動的に出されるようになると、パラメータが増えますので、今までにはできなかった研究が行えるようになります。例えば、脳梗塞と筋肉量という、全く関係ないと思っていたところで繋がりが見えてくる可能性もあります。

このように今までは大変なので取得していなかったデータをAIで取得することにより、新しい発見が色々と見つかることが期待されます。

■関連記事:「多くの病気を治す薬」はこうして発見される【AI時代のくすり作り】

大規模データで心血管疾患のリスクを評価

4本目は、心血管新患のリスク評価にAIを用いた事例です。

心血管疾患は非感染性疾患(NCD)と呼ばれ、全世界の死因の第1位です。NCDには他にもがんや糖尿病、呼吸器疾患なども含まれます。本論文は、大規模データから心血管疾患のリスク評価のためのAI開発について述べています。

それでは、研究の概要を説明していきます。

背景と課題

NCDは、全世界の死因の60%を占めています。各国はNCDを減らすことを目標としており、毎年NCDに関する統計が発表されています。

インドでは心血管疾患(CVD)が多いのですが、そのリスクを適切に評価する研究はあまり行われてきませんでした(註:日本でも脳血管を含めれば、死因の2位ですから他人事ではありません)。

アプローチと結果

インド最大級の病院であるアポロ病院に所属するS. Jallepalliらは、過去7年間のデータを用いて、CVDイベント(急性心筋梗塞、急性冠症候群など)を予測する人工知能モデルを開発しました。

データは、インドのアポロ病院の患者のうち、2010年から2017年までの18歳から91歳までを集計した合計31,599名のものを用いました。そしてスピアマン相関係数とプロペンシティスコア(propensity score, PS)を用いて、21個のリスク因子を決定しました。

その後、決定したリスク因子を使って機械学習モデルを作り、起こりうるCVDイベントの分類とそれまでの時間(ハザードモデル)を構築しました。

その結果、ハザードモデルのAUC(area under the curve)は0.84-0.92を示しました。またリスクがあると判断された患者は、FHRS(Framingham Risk Score)で2.24、QRiskでも1.16を示し、従来のCVDリスク指標でも高い値を示していました。

以上です。大規模なデータからCVDリスクを評価するための説明変数を決定し、その上で機械学習モデルを構築したという実に王道なストーリーですね。インド国内では歴史的な業績になっていると思います。

ソース: Multicenter Retrospective and Comparative Study on a Novel Artificial Intelligence Based Cardiovascular Risk Score (AICVD)

河野先生(医師兼CEO)のコメント

論文の本筋から離れますが、AIで重要と言われるデータ取得について、国による違いを考えてみたいと思います。

データ取得においては、量、質、取得のしやすさ、などが重要になってきます。量においては人口が多い国が有利であり、インドや中国は人口が多く、データを多く集めやすい国です。質については、病院や医療機器が異なるとばらつく傾向にあります。本研究ではインドの単一病院で3万人のデータを取得しており、データ量が多く、質としても単一病院で整っていることが推測されます。一方で、整った質のデータを用いて出した結論(モデル)が、他の病院に適応できるのか、という逆の問題が生じます。

医療データ取得のしやすさに関しては、国による制度の違いの影響を大きく受けます。日本は医療データを取得するハードルが高い国のひとつです。現在、そこを変えようと日本でも国レベルで制度づくりを行っているところです。

■関連記事:クラウドに頼らない、ウェアラブル心電計測

医療に潜む人種差別とその影響の大きさ

5本目は、人種が診断や医療サービスにどれくらい影響するのかについて書かれた論文です。

興味深いとともに驚きです。日本では人種について深く考えることはありませんが、アメリカでは大きな社会問題になっています。その影響は医療においても同様でした。

それでは、研究の概要を説明していきます。

背景と課題

医療者は、人種の差異がもたらす影響について深く学ぶことはありませんが、人種によって医療サービスを変えることは差別と受け取られます。しかし、2004年に黒人に対するヒドラジンとイソソルビドの併用は、白人に対する同じ投薬と比較し、心不全による死亡率を有意に減少させるとの報告がなされました。これ以降、アメリカの各診療科のガイドラインでは人種について言及されはじめました。

その結果、有色人種の疾病リスクが不当に高くなったり、あるいは逆に低く見積もられてしまうことが生じました。

アプローチと結果

アメリカマサチューセッツ総合病院のD. A. Vyasらは、循環器、心臓外科、泌尿器科などの各学会のガイドラインや診断ツールを調査し、人種がもたらす結果の差異について報告しました。

冠動脈バイパス手術のリスク評価法では、人種を白人から黒人に変更するだけでリスクは1.2倍になり、その他の有色人種に変更すると腎不全や脳卒中などのリスクが増加します。また、黒人が腎臓のドナーとなる場合もリスクが高いと判断されます。加えて、経膣分娩は産後の回復時間が短く、その後の合併症も少ないと明らかになっていますが、非白人アメリカ人女性では帝王切開の割合は高くなっています。

また、STONEアルゴリズムという腎結石の診断手順では、根拠なく黒人は腎結石になりにくいとしており、黒人に対する十分な検査が行われない可能性を増加させています。小児の尿路感染症でも同様で、黒人の尿路感染症のリスクは低く設定されており、十分な検査から患者を遠ざけています。

また、2019年に発表された医療用人工知能は、人種差による診断結果の差異を明らかにしました。広く使われているこの臨床ツールは、過去の医療費を考慮に入れており、その結果白人患者がより多くの専門サービスを紹介されていました。白人の方が平均的に多くの医療費を支払うため、白人の疾病リスクを高く評価していたためです。

以上です。学会のガイドラインや診断ツールにまで人種差が持ち込まれていたのは驚きです。しかし著者らは、人種が診断結果と相関関係にあること自体を否定はしていません。人種が何を示しているのか科学的に理解する必要があると強調しています。つまり遺伝的素因を示しているのか、患者の置かれた社会学的背景を示唆するものなのか、よく見極める必要があると繰り返し述べています。

ソース:Hidden in Plain Sight — Reconsidering the Use of Race Correction in Clinical Algorithms

河野先生(医師兼CEO)のコメント

例えば私の専門分野では、脳動脈瘤が破裂して起こるくも膜下出血の頻度は、日本人とフィンランド人で高いことが報告されています。破裂リスクを半定量的に予測するPHASES scoreというものがあり、Pはpopulationの頭文字で、日本人とフィンランド人では点数が高くなり、破れやすいということになります。このように、くも膜下出血の場合は話が比較的シンプルと思います。

一方で話が簡単ではないものもあり、例えば、新型コロナウイルス感染症もそのひとつです。何故、日本ではアメリカに比べて感染者数が少ないのでしょうか?みなさんも色々な仮説が提唱されていることを知っていると思いますが、様々な要因が重なっているため簡単ではありません。

人種差は難しい問題を含みますが、まずは要素を分解して科学的に正しい手法で分析していくことが大切と思います。

■関連記事:【悲報】低所得世帯の物体認識AIは精度が低いらしい

研究紹介は以上です。また次回をお楽しみに!

一緒に働きたいエンジニア募集中!

メディカルAIシリーズでおなじみの河野先生は、現在AIエンジニアを募集しています。

「私の会社、iMed Technologiesでは、世界の手術をより良くしていきたいというビジョンに共感し、一緒に医療現場を変えていきたい、新しい未来を作りたいエンジニアを募集しています! 医療データは豊富にあります。お気軽にご連絡下さい。」

連絡先: vyr01450☆gmail.com(☆を@に変えてください)
Twitter:@CeoImed

河野 健一(こうの・けんいち)先生プロフィール

手術支援AIを開発している株式会社iMed Technologiesの代表取締役CEO。

東京大学理学部数学科卒。京都大学医学部卒。グロービスMBA修了。医師(脳血管内治療指導医、脳神経外科専門医、脳卒中専門医)。

脳神経外科医師として医療現場で16年間勤務。現場で脳血管内手術の課題を感じ、「世界に安全な手術を届ける」という理念を掲げ、2019年4月にiMed Technologiesを設立。現在、くも膜下出血や脳梗塞に対する脳血管内治療のリアルタイム手術支援AIを開発中。

HP: https://imed-tech.co.jp/

【今週の5本】「メディカルAI」最新研究紹介バックナンバー

災害時の身元確認のため、口腔内写真から残存歯を自動認識するAIの研究を行っています。歯科医師/ 歯学博士/ 日本学術振興会特別研究員DC2/ 日本メディカルAI学会公認資格/ 基本情報技術者。Twitter:@historoid1

業界ごとに記事を読む

さらに学ぼう!

PAGE TOP