インクの質感までAI生成できるか。新鋭”DocCreator”(AI×OCR)【論文】

   

研究者の悩みはデータセット不足

文書画像の分析および認識(DIAR)分野の研究者に共通する大きな課題は、注釈付きの文書画像データセットを取得することである。多くのDIARツール(画像復元、レイアウト分析、テキストグラフィック分離、2値化、OCRなど)は、教師あり学習の準備段階を必要とする。

さらに、これらのDIARツールを評価するためには、グランドトゥルースの文書画像データセットが必要であるが、最新かつ著作権フリーで、簡単にダウンロードできるものはほとんどない。そこで、大規模なグラウンドトゥルース文書画像データセットを取得する別の方法として、少数の実画像に基づいて、実質的に無制限量の異なるグラウンドトゥルース合成文書画像を生成する方法が注目されている。

フランスにあるボルドー大学のN. Journetら研究者は、大量のアノテーション付き文書データセットの生成手法が求められているという課題に着目し、研究で使える多くの合成画像文書を生成することができるDocCreatorを紹介した。

結果はどうだったのだろうか。インクの質感など細部までAIで生成できるものなのだろうか?

合成文書画像生成ソフト「DocCreator」の実用性

N. Journetらの研究のミッション・手法・結果は以下の通りだ。

続きを読むには無料会員登録が必要です。


※ログイン/初回登録後、下記ボタンを押してください。

業界から探す

さらに学ぼう!

PAGE TOP