読唇術はAIで出来る時代か。くちびるにご注意を(AI×IoT)【論文】

   

コンピュータで人の唇の動きを読み取る

人とコンピュータは、視覚や聴覚、触覚などを通じてインタラクション可能になってきた。現在では、さらなるインタラクティブな体験の実現のために、読唇認識という新技術に期待が集まっている。読唇とは、話者の唇の動きからその人が言っ​​ていることを認識することだ。

読唇技術を使えば、より効率的で便利なコミュニケーションの方法を確立できるかもしれない。特に、音声の重ね合わせのノイズの多い環境や、聴覚障害のある人々にとって有用な技術となるだろう。しかし従来の読唇認識システムは、認識に時間がかかり、パラメータ数が多いので実用化するのは難しい。

↓はてなブックマークで応援お願いします!
このエントリーをはてなブックマークに追加

中国にある情報科学技術大学院のJing Wenら研究者は、従来の読唇システムの性能だとアプリケーション化するのは難しいという課題に着目し、Raspberry Piに基づくモバイルエンドで高速な読唇認識システムを提案した。

その結果、このシステムの性能はどうだったのだろうか?続きを読んでみよう。

Raspberry Piを用いた読唇システムの構築

J. Wenらの研究における「ミッション・手法・結果」は以下の通りだ。

続きを読むには無料会員登録が必要です。


※ログイン/初回登録後、下記ボタンを押してください。

業界ごとに記事を読む

PAGE TOP
0
Would love your thoughts, please comment.x
()
x