世界トップAI論文を読解(1)「リアルなピアノ演奏をAIで実現する」【コード有】#ICML

   

※本記事は「AIや数学に詳しくないけど論文を読んでみたい人」「国際学会の論文を日本語で楽に読みたい人」「記事タイトルのテーマに興味がある人」に向けて書かれています。

AIの理論やしくみを深く理解するには、研究論文に目を通すのが一番です。しかし、専門家でも理系でもない方が論文を読むのは、ハードルが高すぎますよね。

AI研究の論文は年間何万本も発表されており、専門家でさえもそのすべてに目を通すのは難しいです。しかし、世界のトップカンファレンス(国際学会)で発表された研究成果は、世界中の専門家が注目しており、AI論文の中でも特に一読の価値があると言えます。

そんな注目AI論文を、高度な数学が分からない方にも気軽に読んでいただきたいという思いから、「世界トップAI論文を読解」シリーズを開始しました!

特別に掲載許可をもらいました!

Vol.1では、機械学習のトップカンファレンスの1つである「International Conference on Machine Learning(ICML)」の論文をていねいに読み解いていきます。

ICMLの論文はライセンスの都合上、無断で翻訳・要約することは禁じられていますが、今回は特別に、本シリーズのために記事化の許可を頂いた上でお送りしています!

今回取り上げるのは、韓国の韓国科学技術院のDasaem Jeongら研究者が、ピアニストのように表現力豊かなピアノ演奏をAIで実現することを目指した論文です(論文タイトル:Graph Neural Network for Music Score Data and Modeling Expressive Piano Performance)。

トップカンファレンスを日本語で読める機会は多くないと思いますので、興味がありましたらぜひ読み進めてくださいね!

音楽演奏できるAIはホットな研究領域

飲み会の日程が決まった直後のグループLINEを想像してみてください。幹事が最終決定した日程に対して、グループのメンバーが各々「了解です!」と返信しています。このときの「了解です!」は、文字で打つ限りは皆同じですが、もし対面で話し合っていたとしたら、「了解です!」の言い方は人それぞれ異なるでしょう。声色も、テンションの高さも、アクセントも、人それぞれ違うからです。

音楽の演奏も同様です。楽譜は共通だとしても、楽譜の解釈や演奏の仕方は演奏者ごとに異なるため、実際の演奏の印象は変わります。たとえば、同じ「ねこふんじゃった」をピアノで弾くにしても、すごく高速で弾く人もいれば、強弱をはっきりと弾く人もいます。

こうした演奏パフォーマンスの違いは、客観的なデータとして示すことが難しいように見えます。しかし、もし”凄腕ピアニストの演奏”を定量化するようなことができれば、凄腕ピアニストの演奏を人や機械で再現可能になるでしょう。

昨年末の紅白歌合戦で「美空ひばりAI」が話題を集めたことが記憶に新しいですね。AIを使ってリアルな音楽を自動で生み出す研究は、現在ホットな研究領域です。「表現力豊かな演奏の実現」も研究対象の1つであり、機械学習の研究者は様々な手法を使って実現を試みてきましたが、いずれも完璧なものができたとは言えませんでした。

こうした背景の中で、Jeongらは新たな機械学習手法を用いて、AIによる表現力豊かなピアノ演奏の実現に挑戦しました。

人間に近い演奏ができる”AIピアニスト”の開発

はじめに、Jeongらの研究のポイントを以下に整理します。

✔️ミッション
人間ピアニストの表現力豊かなピアノ演奏をAIで実現したい。

✔️解決手法
「Iterative Sequential Graph Network(ISGN)」という独自のアルゴリズムで、楽譜データから演奏データを予測できるようにした。

✔️結果
従来の手法よりも、人間ピアニストに近いピアノ演奏ができるモデルを開発できた。

それでは、一つ一つ詳しく見ていきましょう。

続きを読むには無料会員登録が必要です。


※ログイン/初回登録後、下記ボタンを押してください。

業界ごとに記事を読む

さらに学ぼう!

PAGE TOP