納税書類をデジタル化!実用可能な品質のデータをOCRで取得(AI×経済)【論文】

   

埋没しているデータ資産の活用

今日のデータ主導型の時代において、企業が競争優位性を獲得するためには、効率的かつタイムリーにデータを活用することが不可欠だ。しかし、多くの組織のデータ資産のほとんどが、半構造化または非構造化フォーマットであり、すぐに活用するのが難しい。

そこで、画像の中の文字をテキストデータに変換するOCR(光学式文字認識)技術を用いることで、データ資産をうまく活用できることが期待されている。ただし、読み取り結果は完璧ではなく、その結果を修正する処理技術を行う必要性がある。



■毎朝AIの最新研究に自動でキャッチアップできるニュースレターはこちら↓


アメリカにあるアーカンソー大学のC. d. Jagerら研究者は、OCR技術の実用に際しては品質を検証および強化する必要があるという課題に着目し、納税証明書の画像をOCRでテキストデータ化し、3通りの処理方法を試した。結果、画像から正確で使用可能なデータを自動的に取得できることが証明された。

OCRで読み込んだテキストを使えるデータに加工する

C. d. Jagerらの研究のポイントは以下の通りだ。

続きを読むには無料会員登録が必要です。


※ログイン/初回登録後、下記ボタンを押してください。


■サポートのお願い
AIDBを便利だと思っていただける方に、任意の金額でサポートしていただけますと幸いです。

    AI新着論文を自動で取得し、日本語サマリーを毎日メールで受け取るサービスに申し込みが殺到しています。
    毎日新しく出版されるAIの論文にキャッチアップするのは、「手間がかかる」「読解が難しい」といった問題あります。
    AIDBは、オートで新着論文の探索を行い、❶論文情報❷日本語サマリーを複数掲載するニュースレターサービスを行っています。

    ■サービス概要
    ① AI新着論文の情報を毎日5件自動で収集
    ② 論文のサマリーを記載
    ③ キーワードをカスタマイズ可能
    ④ 受け取り時間帯を指定可能

    下記のフォームから簡単に申し込みが開始できます。
    価格は現在¥500/月で、3日間は無料でトライアルができます。

    キーワードを詳細にカスタマイズしたり、受け取り時間帯を指定するには、こちらのページから申し込みを行なってください。
    下記のボタンからトライアルを開始した場合、デフォルトの設定(生成AI関連の論文)でサービスをご提供します。
    キーワードや時間帯のご変更は申し込み後も可能です。

    ※初めの3日間は無料です。4日目から引き落としを開始いたします。

    業界/カテゴリー

    PAGE TOP