関連記事:医療の用語に対応した自然言語処理パッケージ「MedCAT」登場!【GitHub】
高精度が要求される生物医学分野向けのモデルが登場しました!

背景
ヘルスケア分野では、構造化されていないテキストデータから情報を抽出する際に障害があり、高い精度が要求されるため手動での抽象化が一般的です。しかし、手動での抽象化は時間がかかりエラーが発生しやすいため、臨床および生物医学領域における自然言語処理(NLP)アプリケーションの人気が高まっています。あらゆるNLPシステムの重要な要素として、名前付き実体認識(NER)は質問回答、トピックモデリング、情報検索などの最初の構成要素とされています。しかし、臨床エンティティなどのセグメンテーションが複雑な構造のため、生物医学NERシステムでは困難な課題と考えられています。
John snow labsのVeysel Kocamanらは、これらの課題を解決する最先端のNERモデルを提示しています。
オリジナル記事の新着はSNSから