読唇術はAIで出来る時代か。くちびるにご注意を(AI×IoT)【論文】

   
★AIDB会員限定Discordを開設いたしました! ログインの上、マイページをご覧ください。

★企業と人材のマッチングサービスを準備中です。アンケートのご協力をお願いいたします!↓

コンピュータで人の唇の動きを読み取る

人とコンピュータは、視覚や聴覚、触覚などを通じてインタラクション可能になってきた。現在では、さらなるインタラクティブな体験の実現のために、読唇認識という新技術に期待が集まっている。読唇とは、話者の唇の動きからその人が言っ​​ていることを認識することだ。

読唇技術を使えば、より効率的で便利なコミュニケーションの方法を確立できるかもしれない。特に、音声の重ね合わせのノイズの多い環境や、聴覚障害のある人々にとって有用な技術となるだろう。しかし従来の読唇認識システムは、認識に時間がかかり、パラメータ数が多いので実用化するのは難しい。


AIDBの全記事が読み放題のプレミアム会員登録はこちらから↓

中国にある情報科学技術大学院のJing Wenら研究者は、従来の読唇システムの性能だとアプリケーション化するのは難しいという課題に着目し、Raspberry Piに基づくモバイルエンドで高速な読唇認識システムを提案した。

その結果、このシステムの性能はどうだったのだろうか?続きを読んでみよう。

Raspberry Piを用いた読唇システムの構築

J. Wenらの研究における「ミッション・手法・結果」は以下の通りだ。

本記事を読むにはAIDBのアカウントが必要です。


※ログイン/初回登録後、下記ボタンを押してください。







■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






業界/カテゴリー

PAGE TOP