実装を試せる「コードありAI論文」今週の5本(2020年6月第1週)読唇術登場ー。

   

最近公開された機械学習の最新論文の中から「ソースコード、事前学習済みのモデル、データセット」が与えられているホットなものを選んで紹介。実際にAIを動かして座学から抜け出そう!

バックナンバーはこちら

今週のラインナップ
1. AIの人間らしい音声の実現
2. 2Dから3Dで人間の関節を推定
3. AIによる読唇術
4. グラフ比較の効率化
5. ロボットの効率的な強化学習

AIの人間らしい音声の実現

NVIDIAが、リアルで表現力のある音声合成モデルを発表しました。

既存の音声合成モデルの多くは、感情や人間のような表現に欠けていることが大きな課題となっています。

この論文の著者であるNVIDIAのRafael Valleらは、既存のモデルよりもリアルな表現を生成し、ユーザーコントロールを向上させた最先端のモデルであるFlowtronを提案しています。

Flowtronはラベルなしで音声合成が可能であり、類似または異なるテキストを持つ文を使用して別の話者に話をさせたり、単調な音声をより表現力のある音声にしたりすることができます。更に他のモデルとは異なりトレーニングデータの可能性を最大化することによって最適化されることで、トレーニングをシンプルかつ安定させます。

実装してみよう!

関連記事▶️人間が楽しめる「落語」音声を合成

2Dから3Dで人間の関節を推定

2D検出器から3Dで人間の関節を推定します。

続きを読むには無料会員登録が必要です。


※ログイン/初回登録後、下記ボタンを押してください。

ロッテノ

投稿者の過去記事

SE2年目に突入。大学では機械工学を専攻していました。製造・工業分野などのAIの活用を深堀して、分かりやすい表現で執筆していきます。

業界ごとに記事を読む

PAGE TOP