最終更新日:2020/02/27
AIはすでに、様々な産業の垣根を超えて活用され始めています。この先のAI応用に関する議論の場は、産業ごとに細分化していくことでしょう。「AI」という軸ではなく「産業」の軸で、幅広い専門性を持った人々が集まり、産業内でAIをどう取り入れていくべきかについて議論が進められていくでしょう。

「日本メディカルAI学会」は、医療分野でのAI応用に特化した学会であり、日本における”産業特化型AI学会”の先駆け的存在です。アイブン編集部は、2020年1月31日~2月1日に東京ビッグサイトTFTホールで行われた、第2回日本メディカルAI学会学術集会に取材参加してまいりました。数々の発表が行われていた中で、編集部が特に興味深いと感じたシンポジウムについて、レポート形式で読者の皆様に共有したいと思います!(全3回)
第1弾のテーマは、”医療の基礎研究におけるAI活用”です。
個別化医療を推進する、細胞・遺伝子レベルでの疾患理解

現在、医療は「個別化医療・個別化予防」に向かって進んでいます。これまでの医療では、一人一人の体質や個人差に合わせた治療を行うことは困難でした。しかし、細胞やゲノムに関するビッグデータを活用することで、より細かく患者を分類し、より適切な治療を選択できるようになります。データサイエンスとAI技術の発展により、こうした個別化医療への道が開かれつつあります。
「データサイエンス・AI駆動型生命医科学研究の新機軸」と題されたシンポジウムでは、個別化医療の実現に向けて、医学の基礎研究領域でAI活用をされている、4名の研究者が発表を行いました。それぞれの研究の要点をまとめます。
細胞同士のコミュニケーションから、薬の効果を予測する
一人目の登壇者は、島村徹平先生(名古屋大学大学院医学系研究科)でした。

研究背景
私たちの体は、約37兆個の細胞で出来ています。これまで、組織(皮膚、筋肉など)や器官(肝臓、心臓など)という単位でのはたらきを知ることはできても、組織や器官を構成する細胞一つ一つがどのような振る舞いをしているのかを知るのは難しいことでした。しかし、昨今の実験技術の進歩により、一つの細胞ごとの状態を観察できるようになってきました。
こうした背景から、島村先生は、細胞同士のコミュニケーションを解明することで、抗がん剤が効くかどうかや、がん患者特有の身体反応を判別することを試みました。
研究概要
一つ目は、最新のがん免疫療法である「抗PD-1抗体」が効くか効かないかを治療前に判別するための研究です。
皮膚がん患者のうち、抗PD-1抗体が効いた5名・効かなかった5名の免疫細胞をそれぞれ採取し、細胞の表面や内部にある40種類のタンパク質を測定できる「CyTOF」という解析システムを適用しました。ここで得られたデータに対し「LONGINUS」という独自の計算技術を用いて、細胞の数や、数の変化、劇的に数が変化するポイントなどを同定しました。
その結果、「CD19- HLA-DR+ 骨髄球」という免疫細胞が治療前に多いと、抗PD-1抗体治療が有効である可能性が高いことが分かりました。
二つ目は、がん特有の細胞間コミュニケーションを特定するための研究です。
8人の乳がん患者から47015個の19種類からなる免疫細胞を採取し、それぞれのRNAの配列を調べる「シングルセルRNA-seq」という解析システムを適用しました。ここで得られたデータを、リガンドとレセプター*の共発現テンソルデータに変換し、「tidyBNMF」という独自の機械学習アルゴリズムで分析し、細胞同士がどのように結びついているかを明らかにしました。
*「リガンドとレセプター」とは…細胞の表面には、様々な物質を結合するレセプター(受容体)がある。特定のレセプターに結合する物質のことをリガンドと呼ぶ。
その結果、「マクロファージとB細胞が、あるリガンドとレセプターを介して結びついている」などといった、乳がん患者特有の細胞間コミュニケーションを明らかにすることができました。
このように、細胞同士のコミュニケーション解析に機械学習を取り入れることで、治療薬の効果の予測や、細胞レベルでの疾患理解が進み、より個人に合わせた治療法の開発につながるでしょう。
病名は一つでも病状は複数、機械学習が病気のバリエーションを新発見
二人目の登壇者は、川上英良先生(理化学研究所、千葉大学大学院医学研究院)でした。

研究背景
がんやアトピー性皮膚炎などの多くの疾患は、同じ病名であっても、患者の病状はそれぞれ異なります。個別化医療に向かっていくためには、これまで一言で表されていた疾患を細かく再分類する必要があります。疾患の再分類ができれば、高い正確性で病状変化を予測することにもつながり、病気の悪化や合併症への発展を防ぐことも期待できます。
AIは、病気の再分類に有用であると考えられます。川上先生は、正解データを与えない教師なし学習を用いた卵巣腫瘍の再分類と、糖尿病の状態変化のパターン分類を行いました。
研究概要
がんは大きく、良性がん・早期がん・進行がん・悪性がんに大別できます。これまでの研究では、機械学習アルゴリズムを用いることで、92%の精度で良性がん・悪性がんを見分けることには成功していましたが、早期がん・進行がんの分類は容易ではありませんでした。
川上先生は、卵巣腫瘍患者の血液検査結果について、「ランダムフォレスト」で機械なし学習を行い、患者の分類を試みました。その結果、「早期がん」には2種類のタイプがあることが分かりました。1つは、進行がんと似ており、5年以内に約1/4が再発か死亡するタイプです。もう1つは、良性がんと似ており、5年以内に再発もわずかで死亡数もゼロであるタイプです。こうして、卵巣腫瘍における早期がんの新分類を発見することができました。
また、川上先生は、身体の状態の移り変わりを、デコボコの地形をボールが転がっていくような様子に例えて計算する手法である「ランドスケープモデル」を用いて、5年分の健康診断のデータから糖尿病の進行パターンの分類を試みました。その結果、糖尿病を経てから肥満や高血圧になる人や、肥満を経てから糖尿病になる人がいるなど、糖尿病を罹患する前後の状態には9種類あることが判明しました。
このように、機械学習を用いて既存の概念を見直すことで、病状の違いや病気の進行パターンの新分類の発見につながり、個別化医療の実現が後押しされるでしょう。
「個人差」を遺伝子レベルで説明し、生命理解の新たな扉を開く
三人目の登壇者は、岡田随象先生(大阪大学大学院医学系研究科)でした。

研究背景
近年の大規模なヒトゲノム研究によって、1000種類以上の病状に関わる遺伝子のみならず、生活習慣の個人差を生み出すような遺伝子も明らかになってきました。たとえば、お酒への強さを決める「ALDH2遺伝子」は、お酒のみならず、コーヒーや紅茶、納豆などの摂取量にも影響し、日本人集団の適応進化と深く関わっていることが分かっています。
こうした背景から、個人の遺伝子を調べることで、将来生活習慣病などの病気を罹患するリスクを予測し、予防医療につなげようとする試みが行われています。しかし、ゲノム情報は在住地域ごとに特定の偏りを示すなど、一筋縄ではいかないことが分かりました。岡田先生は、もっと深くヒトゲノムを理解するために、機械学習を有効な手段だと考えました。
研究概要
岡田先生は、講演中に自身について「自分はゲノムデータを機械学習にかけるしか能がない男」と称して聴衆の笑いを誘っていた通り、さまざまなゲノムデータに機械学習を適用した事例を紹介しました。たとえば、白血球の「HLA遺伝子」は、単純に組み合わせを計算すると10の24乗通りあると言われていますが、非線形の機械学習を用いることで、11パターンほどの組み合わせに分類できることが分かりました。また、腸内細菌のメタゲノムに非線形の機械学習を用いると、病気の患者と健常者の間で違いのある菌種を効率的に分類可能なことが明らかになりました。
他にも、様々な機械学習手法を適用することで、日本人集団のゲノム情報が在住地域によって異なる傾向を示すことや、ミトコンドリアゲノムが核ゲノムとは異なる特徴を持つことを明らかにしたといいます。さらに、遺伝統計学分野の若手人材育成のために、夏季短期セミナーである「遺伝統計学・夏の学校@大阪大学」を開催していることを報告しました。
岡田先生は、「機械学習のアルゴリズムを知ることと、リアルデータに応用したときに何が見えてくるかは、全く別の次元の話である」と述べ、様々なデータを様々なアルゴリズムで積極的に分析していくべきであると強調しました。ゲノムの9割以上は「意味のない配列」だとされていますが、機械学習によって新たな発見が生まれることで、個別化医療の推進のみならず、生命の謎の解明にもつながっていくでしょう。
ゲノム解析を自動化し、世界と戦える知識データベースを作る
最後の登壇者は、白石友一先生(国立がん研究センター研究所)でした。

研究背景
ゲノムデータを機械学習で解析することで新しい発見が期待できるとはいえ、すべての解析を人間が手作業で行っていては、世界競争に勝てません。白石先生は、遺伝子変異と薬の効きやすさの結び付きなどの情報を収集した「知識データベース」を作る過程を自動化する試みを行いました。
研究概要
白石先生が着目したのは、疾患との関連性が高く、創薬や治療の役に立つ遺伝子変異を、大量のゲノムデータの中から自律的に蓄積することでした。中でも、多くの疾患の原因である「スプライシング異常」につながる変異の発見に努めました。スプライシング異常とは、細胞内で遺伝情報をもとにタンパク質が作られる際、不要なDNA配列を適切に削除する過程(スプライシング)に失敗することを指します。スプライシング異常により、細胞内のタンパク質が正しく作られなくなり、様々な疾患につながります。
白石先生は、DNA配列のデータベースである「DDBJ Sequence Read Archive」内のデータに統計的手法を適用し、スプライシング異常に関わると判断した遺伝子変異を抽出しました。また、この抽出作業を自動化するために、Amazonのクラウドサービスを用いて、安価に大量データの解析が行えるような環境構築を行いました。現在は、1検体20円ほどで、1日あたり1600検体ほどの解析を行うことができるようです。
こうして発見されたスプライシング異常に関わる遺伝子変異が、疾患と関連するのかを調べるために、疾患と遺伝子の関連情報を集めたデータベース「ClinVar」と照合したところ、すでに解析を終えた1万検体のうち、80個は既知の遺伝子変異であると分かりました。また、1万検体のうち60個は、ClinVarに報告されている変異と近い部位にある変異だと分かりました。これらは、病気に関わる新たな遺伝子である可能性があり、医学の発展に寄与する重要な発見となります。
このようなゲノムデータの解析を自動化するプログラムは、新たな疾患理解をいっそう加速させていくことが期待できます。今は指数関数的にデータが蓄積されていく時代、人間と機械がタッグを組むことは必須でしょう。
連載「日本メディカルAI学会2020 レポート特集」(全3回)
第1弾 病気研究がAIで加速、個人に合わせた医療の実現をめざして
第2弾 画像認識AIは、患者と医師の良きパートナーになる
第3弾 「AIの目」が人間のミス発生を防ぐ!安全な手術を支援するAIシステム
■サポートのお願い
AIDBを便利だと思っていただける方に、任意の金額でサポートしていただけますと幸いです。
オリジナル記事の新着はSNSから