「音声翻訳」が誰でも試せる!実装を試せる「コードありAI論文」5選【週刊】

   
↓はてなブックマークで応援お願いします!
このエントリーをはてなブックマークに追加

最近公開された機械学習の最新論文の中から「ソースコード、事前学習済みのモデル、データセット」が与えられているホットなものを選んで紹介。実際にAIを動かして座学から抜け出そう!

バックナンバーはこちら

今週の5本ノック
1本目. GANで顔に特徴を追加しよう
2本目. 多言語の翻訳をしよう
3本目. SVGファイルを生成しよう
4本目. 物体を検出してみよう
5本目. 人間の姿勢を推定しよう

GANで顔に特徴を追加しよう

GANの精度が向上しました!(2020年7月12日公開)

顔の編集では口髭の追加や髪色の変更などを目的としています。

この論文の著者であるZhenliang Heらは、顔を編集するためのPA-GANを提案しています。

PA-GANでは特徴レベルの高いものから低いものまで編集が可能であり、無関係な領域に不要な変更を加えることを防ぎます。髭の追加、髪色の変更など、変更したい箇所をピンポイントに変更できる程に精度が向上しています。

実装してみよう!

多言語の「音声」翻訳をしよう

多言語の音声を翻訳したデータセットが登場しました!(2020年7月20日公開)

続きを読むには無料会員登録が必要です。


※ログイン/初回登録後、下記ボタンを押してください。

ロッテノ

投稿者の過去記事

SE2年目に突入。大学では機械工学を専攻していました。製造・工業分野などのAIの活用を深堀して、分かりやすい表現で執筆していきます。

業界/カテゴリー

PAGE TOP