動画中から”難関”アラビア語の抽出なるか(AI×エンタメ)【論文】

   
★AIDB会員限定Discordを開設いたしました! 会員登録/ログインの上、マイページをご覧ください。
★コンサルティングサポート(調査・研修・開発支援)をご希望の方はお問合せください。

動画中の文字の認識はむずかしい

テレビ番組に字幕やテロップがあるおかげで、番組をじっくり観ていなくても、話の筋を簡単に目で追うことができる。テレビに限らずYouTubeなどでも、動画中に埋め込まれたテキストは、その動画コンテンツの重要ポイントを視聴者に伝えている場合が多い。

動画のようなファイルサイズの大きいデータを保存できる大容量記憶技術の急速な進歩のおかげで、世界中で膨大な数のニュース動画が保存されるようになった。想像してみてほしい。これらの膨大な動画のすべてに対し、人間が手動でテキストを埋め込む(アノテーションする)ことはできるだろうか?きっとお手上げ状態になることだろう。

こうした人手不足な状況で活躍が期待されているのが、動画中の文字を自動認識する技術(OCR:光学式文字認識)である。OCRは通常、画像中の文字を認識するものだが、その応用として、これまでいくつかの研究で動画中の文字認識が試されてきた。しかし、研究事例の多くはラテン語や中国語に特化しており、アラビア語には対応していなかった。


AIDBの全記事が読み放題のプレミアム会員登録はこちらから↓

チュニジアにあるスース大学のO. Zayeneら研究者は、動画における文字認識に取り組む上で、複数タスクに対応できるアラビア語のデータセットがなかったという課題に着目し、AcTiVデータセットの新しいバージョンを紹介し、複数のテキスト検出および認識アルゴリズムを比較した。結果、性能の良い手法が明らかになった。

アラビア語のニュース動画の文字認識に挑戦

O. Zayeneらの研究のポイントは以下の通りだ。

本記事を読むにはAIDBのアカウントが必要です。


※ログイン/初回登録後、下記ボタンを押してください。







■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






業界/カテゴリー

PAGE TOP