【論文実装】今週取り組むべき5本(2020年5月第4週版)初心者向けディープラーニング学習ツール−。

   

最近公開された機械学習の最新論文の中から「ソースコード、事前学習済みのモデル、データセット」が与えられているホットなものを選んで紹介。実際にAIを動かして座学から抜け出そう!

バックナンバーはこちら

今週のラインナップ
1. 初学者向けのディープラーニング学習ツール
2. タスク指向の対話への新たなアプローチ
3. GIMPにディープラーニング
4. 人体パーツの認識
5. ディープラーニングで画像検索

※エントリーについて

各論文・Githubや公式サイトで示されている実装手法に基づいて、何らかの題材をもとに技術を活用した/する意欲がある方は、各トピックスにある「エントリー」よりご連絡ください。結果にかかわらず取材させていただき、メディアでPRさせていただきます。

初学者向けのディープラーニング学習ツール

AI技術を初学者が学びやすいように新たなツールが開発されました。

ディープラーニングの大きな成功は、多くの実務家や学生がこの技術について学ぶ動機となっています。しかし、ディープラーニングは複雑であり初心者が最初の一歩を踏み出すには敷居が高く感じます。

論文著者のZijie J. Wangらは、CNN Explainerを提案しています。これは非専門家が基本的なディープラーニングのモデル構造である畳み込みニューラルネットワークCNN)を学習・調査するために設計された対話式の視覚化ツールです。

CNN ExplainerはオープンソースでWebブラウザで実行することができ、最新のAI技術の学習方法を拡大します。これによりディープラーニングの学習の敷居が下がることが期待されます。

実装してみよう!

タスク指向の対話への新たなアプローチ

タスク指向の対話の新たなアプローチにより、従来の方法よりも優れた結果をもたらします。

タスク指向の対話(ユーザーが何かタスクを実行したいという目的のある対話)は、多くの場合に「ユーザー入力の理解」、「アクションの決定」、「応答の生成」の3つのタスクに分けられます。

論文著者のBryan McCannらは、単一の因果的言語モデルを使用する、タスク指向の対話(SimpleTOD)への簡単なアプローチを提案しています。これを行うためにトレーニング中に、対話状態の追跡、アクション、および応答生成のすべての入力を単一のシーケンスとして扱います。 

マルチドメインダイアログデータセットであるMultiWOZでの実証結果は、提案されたアプローチが特にタスク指向の対話システムの評価に適した設定において、すべての従来の方法よりも優れていることを示しました。対話システムのシンプルで統一されたアプローチのさらなる研究の促進が期待されています。

実装してみよう!

GIMPにディープラーニング

フリー画像編集ソフトであるGIMPにディープラーニングを活用したプラグインを適用します。

ディープラーニングモデルの活用により手動で時間のかかる画像処理を簡略化することができます。

論文著者のKritik Somanは、フリー画像編集ソフトとして広く普及しているGIMP用のPythonプラグインのセットである、GIMP-MLを紹介しています。

セマンティックセグメンテーション、画像超解像、ノイズ除去、カラーリングなどのディープラーニングよるアプリケーションが、Pythonベースのプラグインを介してGIMPに組み込むことができます。これはディープラーニングの活用の利点を画像処理のワークフローにもたらすことを目指しています。

実装してみよう!

人体パーツの認識

人の解析のための新たなモデルが登場しました。

今までの研究から人体の境界とポーズは、人の解析にとって2つの有益な要素と言われています。しかし、人間の解析タスクには、隣接する2つのパーツ間の境界の局所化の不正確さ、セグメント化されたカテゴリの意味の不一致という 2つの問題があります。

論文著者のZiwei Zhangらは 人の境界・ポーズ・解析要素から特徴の相関関係を取得するための相関解析マシン(CorrPM)を提案しています。これはセマンティックセグメンテーションから隣接する2つのパーツの境界の区別と、人のセグメント化されたカテゴリを体のパーツと一致させます。

また、境界・ポーズ・解析要素の関係を調査し、人間の解析タスクのコンテキストキューを提供します。CorrPMは3つのベンチマークでの実験で有効性を示しています。

実装してみよう!

ディープラーニングで画像検索

画像検索にディープラーニングを活用するためのPythonライブラリが開発されました。

コンテンツベースの画像検索(画像の特徴から類似した画像を検索する技術)の分野にディープラーニングを活用することは大きな進歩にもかかわらず、統一された方法でこれらをカバーするソフトウェアライブラリはありませんでした。

論文著者のBenyi Huらは、深層学習ベースの教師なし画像検索に焦点を当てたソフトウェアライブラリであるPyRetriを提案しています。これはコンテンツベースの画像検索のパイプラインを統合し、多くのマルチメディアアプリケーションに簡単に採用できる各検索機能に便利なインターフェイスを提供します。

PyRetriは、ディープラーニングによる教師なし画像検索のための最初のオープンソースライブラリとさています。

実装してみよう!

研究はただの座学や基礎理論に終わらず、現場に落とし込める存在。そうした世界観を拡げていきたいです!

次回もお楽しみに!

バックナンバーはこちら

業界から探す

さらに学ぼう!

PAGE TOP