インクの質感までAI生成できるか。新鋭”DocCreator”(AI×OCR)【論文】

   
★AIDB会員限定Discordを開設いたしました! ログインの上、マイページをご覧ください。

★企業と人材のマッチングサービスを準備中です。アンケートのご協力をお願いいたします!↓

研究者の悩みはデータセット不足

文書画像の分析および認識(DIAR)分野の研究者に共通する大きな課題は、注釈付きの文書画像データセットを取得することである。多くのDIARツール(画像復元、レイアウト分析、テキストグラフィック分離、2値化、OCRなど)は、教師あり学習の準備段階を必要とする。

さらに、これらのDIARツールを評価するためには、グランドトゥルースの文書画像データセットが必要であるが、最新かつ著作権フリーで、簡単にダウンロードできるものはほとんどない。そこで、大規模なグラウンドトゥルース文書画像データセットを取得する別の方法として、少数の実画像に基づいて、実質的に無制限量の異なるグラウンドトゥルース合成文書画像を生成する方法が注目されている。


AIDBの全記事が読み放題のプレミアム会員登録はこちらから↓

フランスにあるボルドー大学のN. Journetら研究者は、大量のアノテーション付き文書データセットの生成手法が求められているという課題に着目し、研究で使える多くの合成画像文書を生成することができるDocCreatorを紹介した。

結果はどうだったのだろうか。インクの質感など細部までAIで生成できるものなのだろうか?

合成文書画像生成ソフト「DocCreator」の実用性

N. Journetらの研究のミッション・手法・結果は以下の通りだ。

本記事を読むにはAIDBのアカウントが必要です。


※ログイン/初回登録後、下記ボタンを押してください。







■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






業界/カテゴリー

PAGE TOP