
最近公開された機械学習の最新論文の中から「ソースコード、事前学習済みのモデル、データセット」が与えられているホットなものを選んで紹介。実際にAIを動かして座学から抜け出そう!
バックナンバーはこちら
今週の5本ノック
1本目. NLPモデルを軽量化しよう
2本目. AIで多言語を読み上げよう
3本目. Q&Aを自動化しよう
4本目. AIに文章を理解させよう
5本目. 少ないトレーニングで画像操作しよう
NLPモデルを軽量化しよう
自然言語処理(NLP)のための新たなベースモデルが登場しました!(2020年8月3日公開)

NLPモデルのBERT、XLNetなどにはTransformerというアーキテクチャが使用されています。
この論文の著者であるSachin Mehtaらは、TransformerベースのモデルであるDeLighTを提案しています。
DeLighTは従来のTransformerベースのモデルと比較してパラメータを必要とせず、パラメータを8倍、操作を2倍削減した状態でベースラインを超えるパフォーマンスを実現します。また、機械翻訳と言語モデリングタスクの実験でも、DeLighTがベースラインのトランスの性能とかなり少ないパラメータで一致していることが示されています。
実装してみよう!
AIで多言語を読み上げよう
多言語の音声読み上げモデルが登場しました!(2020年8月3日公開)

オリジナル記事の新着はSNSから