ヒット映画のタイトルをAIで分析した結果わかったこと【AI×エンタメ】(論文解説)

   
↓はてなブックマークで応援お願いします!
このエントリーをはてなブックマークに追加

映画が売れるために重要なこととは

近年の機械学習の普及によって、映画の売上予測がされるようになりました。映画業界はリスクが大きいため、利益を回収するためには売り上げを予測することがとても重要です。しかし、中国のような国では低予算映画が売れにくく、一握りの映画だけが売れているのが現状です。

それでは、どのような映画が売れているのでしょうか。ある研究者らは機械学習を用いて、映画のレビューから映画の成功を予測しました。しかし、映画製作の前にどれくらい売れるか予測できなければ良い映画を作ることは難しいです。完成前に売り上げを知りたい製作陣にとっても、売り上げを低コストで調整できる要素でなければなりません。

映画業界における売上予測において、実際にどのような研究が行われているのでしょうか。Xingyao Xiaoら研究者の発表を紹介します。

研究者らは、映画のタイトルに着目しテキストマイニングや探索的因子分析(EFA)を用いることによって、売れている映画の傾向を調べました。

米・中の映画タイトル分析

まずはXingyao Xiaoらの研究におけるミッション・手法・結果をまとめました。

✔️ミッション
どのような映画が売れているのか調べたい。

✔️解決手法
映画のタイトルに着目し、テキストマイニングや探索的因子分析(EFA)を行った。

✔️結果
アメリカと中国における売れている映画の特徴が分かった。

ミッションから説明していきます。

売れる映画タイトルの特徴の調査

映画業界はリスクがとても大きいです。実際、アメリカではディズニー映画だけで2009年の興行収入の約33%を占めています。また、中国のような、指数関数的に視聴者が増える国では、低予算の映画が売上を出すのはとても難しいです。

それでは、どのような要素を持った映画が成功しているのでしょうか。これに関してさまざまな研究が行われています。例えば、機械学習を用いて視聴者からのレビューを基に売上予測するモデルや、中国で最も人気のあるブログサイトSina Weibo(新浪微博)のレビューを基に、映画の興行収入を予測する機械学習モデルが構築されています。

このように、視聴者からのレビューを基に映画の売上予測をすることは可能ですが、完成前にどのくらい売り上げるかを予測することがとても重要です。そこで Xingyao Xiaoらは、視聴者の第一印象である映画のタイトルを分析することを選択しました。

タイトルをテキストマイニング

Xingyao Xiaoらはアメリカと中国で人気の映画のタイトルに含まれるキーワードを視覚化し、比較するためにテキストマイニング探索的因子分析(EFA)を行いました。

テキストマイニング

テキストマイニングは、テキストの特徴や、どのようなパターンが含まれているかを調べる方法です。ビックデータの活用においてもとても重要な技術となっています。

下図はテキストマイニングの流れです。テキストの絞り込みと情報の蒸留の二段階に分けられます。テキストの変換は、テキストを1つの特定の中間形式に変換し、情報の推論は、中間形式によって明らかにされた情報または特徴を推論する段階です。

テキストマイニングの流れ

探索的因子分析(EFA)

探索的因子分析(EFA)は変数の複雑さをシンプルにする方法のことです。テキストでは、単語1つ1つが変数となり、その特徴を探す手法です。下図はEFAのモデルです。EFAは主に4つの要素で構成されています。

  • 変数: 角丸長方形(X1~X5)
  • 因子: 楕円(Factor1~Factor3)
  • エラー項: 長方形(Error1~Error5)
  • 影響を及ぼす方向: 矢印(→)
探索的因子分析(EFA)モデル

ファミリー映画は売れる?

結果、アメリカと中国における売れている映画の特徴を調べることができました。

Xingyao Xiaoらは、2015年から2019年の間に公開されたアメリカと中国における人気映画のタイトルでEFAとテキストマイニングを行いました。

アメリカと中国における映画の統計

下表はアメリカと中国で最も人気のある50の映画のタイトルのキーワードや興行収入の統計です。最も頻繁に登場するキーワードは”man”です。これは、スーパーヒーロー映画の人気に由来しています。アメリカで2番目に多い”star”は、スターウォーズがヒットしたことを明らかにしています。中国でも9番目に登場するため、両国で人気であることが分かります。3番目の”movie”は、映画のことを”the movie”と名付ける一般的な法則に由来している可能性が高いです。

アメリカと中国で人気のある映画の統計(一部抜粋)

映画のタイトルキーワードを視覚化すると下図のようになります。多く登場しているキーワードほど大きく、登場回数が少ないキーワードが小さくなっていることが分かります。両国において多く登場するキーワードとしてはman, star, movieがあります。

アメリカの映画タイトルキーワード
中国の映画タイトルキーワード

次に、2015年から2019年の間にアメリカと中国で公開された映画の総興行収入を比較しました。下表はアメリカと中国の総興行収入の統計です。アメリカで公開された217本の映画と中国で公開された245本の映画に基づいて、アメリカの映画は Xingyao Xiaoらが選んだ5つの統計量すべてにおいて、中国の映画の統計量を上回る結果となりました。

アメリカと中国の総興行収入の統計

アメリカにおける探索的因子分析(EFA)の結果

アメリカで人気のある映画のタイトルキーワードトップ50のEFAが217本の映画で行われました。

下表は各因子の相関表です。重要な因子ほど上に配置されています。ファミリー映画と続編の映画は互いに正の相関があります。しかし、ホラー・スリラー映画とファミリー映画・続編の映画は両者とも負の相関があることが分かります。

  • FA1: 続編の映画
  • FA2: ファミリー映画
  • FA3: ホラー・スリラー映画
各因子の相関表(アメリカ映画)

ファミリー映画はアメリカで人気のある映画の1つです。あらゆる年齢層が楽しめるジャンルとなっているので、他のジャンルよりも視聴者が多いです。続編の映画は、スターウォーズやトイストーリーの続編などの成功に起因しています。3番目に抽出されたホラー・スリラー映画は、より多様な映画タイトルをカバーしています。

中国における探索的因子分析(EFA)の結果

同様に、中国の映画でもEFAが行われました。

下表は各因子の相関表です。アメリカの映画市場と同じく、ファミリー映画と続編の映画は中国でも人気です。続編の映画の因子に含まれる要素は全てスターウォーズシリーズとなっていて、並外れた記録をたたき出していることが分かります。

  • FA1: ファミリー映画
  • FA2: コメディ映画
  • FA3: 探偵映画
  • FA4: アクション映画や犯罪をテーマにした映画
  • FA5: 続編の映画
各因子の相関表(中国)

中国の人気映画で、抽出された新しい因子はコメディ映画とアニメーション映画です。3番目に抽出されたアクション映画・犯罪をテーマにした映画は、多様な映画が含まれています。このテーマとは異なり、中国の観客はコメディ要素を持つ映画を好む傾向にあります。5番目に抽出された探偵映画は、日本のコナンシリーズがほとんどです。コナンシリーズは中国で絶大な人気を得ています。シリーズ初期は恐怖の要素が大きかったですが、最近のコナンシリーズは家族向けとなっています。

アメリカと中国間の映画の分析

まず、アメリカと中国の共通点を挙げます。両国ともファミリー映画を強く好む傾向にあり、大半はアニメーション映画です。また、スターウォーズの人気が国際的であることも分かります。

次に、異なる点を挙げます。中国の観客は、探偵映画やアクション映画、犯罪をテーマにした映画などの深刻なテーマを好む傾向にあるのにもかかわらず、興行収入が多い映画にはコメディ要素が含まれている傾向にあります。アメリカの観客はホラーとスリラーの要素を高く評価する傾向にあります。タイトルの名付け方は多様なものですが、”angel”や”death”などのキーワードを用いて、アメリカの多様な宗教観念に当てはまるように考慮しています。

このような結果から、売れている映画のタイトルを分析することによって、どのような映画がヒットしやすいのかを分析することができました。

研究紹介は以上です。このような研究を行うことによって、各国の観客がどのような映画を求めているのかが分かるようになります。今後、さらなる面白い映画が登場することを期待したいです。


この記事で取り扱った論文:Xingyao Xiao, Yihong Cheng and Jong-Min Kim,”Movie Title Keywords: A Text Mining and Exploratory Factor Analysis of Popular Movies in the United States and China”,MDPI DOI


業界/カテゴリー

PAGE TOP