精密医学、ビッグデータ活用で遂に実現するか(AI×医療)【論文】

   

(Featured AI and healthcare) Structure for Precision Medicine with Big Data Analysis (Publication)

[論文] M. Moscatelli, A. Manconi, M. Pessina, G. Fellegara, S. Rampoldi, L. Milanesi, A. Casasco and M. Gnocchi, “An infrastructure for precision medicine through analysis of big data”. BMC Bioinformatics, 19(10), 351 (2018). [DOI: 10.1186/s12859-018-2300-5]

3つの要点

✔️良い精度でサンプルの場所、疾患の存在および疾患の状態を分類できた。

✔️様々な種類のデータを統合した。

✔️類似の病理を発症した患者達の病歴を学習すれば早期診断が可能になるかもしれない。

概説

背景

最近では、分子生物学の結果の取得における進歩とシステム生物学シミュレーション技術の進歩により,オミクスデータの利用可能性が増加しており,精密医学の基礎を提供している。
精密医療の成功は医療と生物医学データへのアクセスにかかっている。
この目的のために、すべての臨床検査と医療記録のデジタル化が病院で標準になりつつある。
デジタル化は、生物医学目的のための予測モデルを定義する目的で、隠れたパターンの発見を支援するために、大量の異種データを収集、共有、および集約するのに不可欠である。
患者のデータ共有は重要なプロセスだ。
実際、適切に対処しなければならない倫理的、社会的、法的、技術的な問題が提起されている。

結果

本研究では大量の異なる生物データの統合を扱うために考案されたインフラストラクチャー(図1)を提示した。
このインフラストラクチャは、イタリアの主要な診断分析研究所のひとつで2010~2016年に収集されたデータに適用された。
三つの異なるプラットフォームからデータは集められた(すなわち、臨床検査、病理解剖検査、生検検査)。
このインフラストラクチャは、非構造化データと半構造化データの両方を抽出、集約できるように設計されている。
データは、データの安全性とプライバシーが確保されるように適切に処理される。
また、1人以上の患者の臨床活動の正確な履歴分析を得ることを目的として、集計された情報を処理するための特殊なアルゴリズムも実施されている。
さらに,フリーテキストとして報告された検査を分析(図2)するために、3つのベイズ分類器を開発した。
実験結果は、分類器をサンプルの場所(図3)、疾患の存在および疾患の状態(図4)に関連する文章を分析するために用いると良好な精度を示すことを示した。

結論

このインフラは、異なる臨床プラットフォームからの匿名データの複数の異種ソースの統合を可能にする。
構造化されていないデータと半構造化されたデータの両方を処理して、1人以上の患者の臨床活動の正確な履歴分析を得る。
データ集約によって、予測や精密医学など、さまざまな分野で使うことのできる複雑な問題に答えるために必要な一連の統計的評価を行うことができる。
特に、類似の病理を発症した患者達の病歴を学習(図5)することは、可能性のある疾患の早期診断を可能にするマーカーを予測または特定するのに役立てられる。

図1:全体像。データを集める層、匿名化する層、機械学習と異なるソースからのデータをくっつけて文字テキストを管理する層、ビッグデータ解析を行う層の4つからなる。
図2:機械学習の全体像。データ集約の後に主となる情報を抽出し、4種類のベイズ分類機が試され、4つのパラメータで結果を判断することで分類機を向上させる。
図3:サンプルの場所を「一般」と「消化器」の二つに分類した結果。
正解率の平均は0.98であり、黄色がヒートマップを占めていることはシステムがサンプルの場所を分類することが可能であることを確証している。
図4「正常」「さらなる観察が必要」「病気」「腫瘍性」「前腫瘍性」に分類した結果。正解率の平均は0.8である。
図5 患者は2010~2016年の間に病状の変化に従ってグループ化されている。青い枠で囲まれている130人が関係ある患者であり、彼らは観測期間中に病気が現れている。

著者

Marco Moscatelli (Institute for Biomedical Technologies National Research Council (CNR-ITB))
email: marco.moscatelli@itb.cnr.it

Andrea Manconi (Institute for Biomedical Technologies National Research Council (CNR-ITB))

Mauro Pessina (Centro Diagnostico Italiano)

Giovanni Fellegara (Centro Diagnostico Italiano)

Stefano Rampoldi (Centro Diagnostico Italiano)

Luciano Milanesi (Institute for Biomedical Technologies National Research Council (CNR-ITB))

Andrea Casasco (Centro Diagnostico Italiano)

Matteo Gnocchi (Institute for Biomedical Technologies National Research Council (CNR-ITB))

出版情報

Published: 15 October 2018

This article has been published as part of BMC Bioinformatics Volume 19 Supplement 10, 2018: Italian Society of Bioinformatics (BITS): Annual Meeting 2017 (Cagliari, Italy. 05-07 July 2017). The full contents of the supplement are available online at https://bmcbioinformatics.biomedcentral.com/articles/supplements/volume-19-supplement-10

Open Access This article is distributed under the terms of the Creative Commons Attribution 4.0 International License(http://creativecommons.org/licenses/by/4.0/), which permits unrestricted use, distribution, and reproduction in any medium, provided you give appropriate credit to the original author(s) and the source, provide a link to the Creative Commons license, and indicate if changes were made. The Creative Commons Public Domain Dedication waiver(http://creativecommons.org/publicdomain/zero/1.0/) applies to the data made available in this article, unless otherwise stated.

Reprints and Permission

業界ごとに記事を読む

さらに学ぼう!

PAGE TOP