3Dのリアルな画像から「あらゆるテキストデータを抜きとるAI技術」発表【CVPR2020】

   

関連記事:「3D×AI」の最先端を紹介します。トップ学会に採択された論文たち【CVPR2020】

以下では、画像認識技術のトップ学会であるCVPRにおいて今年発表された論文の中でも、特に筆者が面白いと感じたものを紹介します。テーマは3Dです。

“シーンテキスト”を探す旅

画像には様々な情報が含まれていますが、特に町中での画像には、標識や看板が写っていることがあります。そして基本的に、標識や看板にはテキストが書かれていますが、それらを Scene Text と呼びます。シーンテキスト多くの情報を含んでおり、画像の一部についての説明や手掛かりになっています。この論文は、2次元画像ではなく、3次元シーンからシーンテキストを生成しようという内容です。

続きを読むには無料会員登録が必要です。


※ログイン/初回登録後、下記ボタンを押してください。

業界ごとに記事を読む

さらに学ぼう!

PAGE TOP