「釣り場の盛り上がり」を感情分析で捉えてみた(AI×釣り)【実装】

   

釣り場が一番盛り上がる時期はいつなのか?

こんにちは。釣りを趣味としながらAI開発を本業としています、つりくず(@kuzu_tsuri)です。4月はCOVID-19のため、釣りを自粛しております。。。

ですが、釣りにいけない間でも釣り場のデータ分析やモデル開発をすることで、少しでもこの状況で盛り上げることができたらと思っています!

そこで、今回は前回に引き続き、釣り場の感情分析をより深めていこうと思います。

前回の記事:ツイートを感情分析して「良い釣り場」を探してみた

前回の課題を克服

前回の記事では、Twitter上で釣りに関するツイートを収集し、感情分析を行うことで、若洲海浜公園、豊洲ぐるり公園、東扇島西公園の中で、最もポジティブな反応がある釣り場を探索しました!

結果としては、東扇島西公園が最もポジティブなツイートが多く、かつネガティブなツイートも少ないことが分かりました。

ただ、前回の記事には2つの課題がありました。

課題1:感情分析で利用した辞書は釣りに特化したものでなく、一般的なものであるため、分析結果に釣りの観点が含まれていない。
課題2:収集したツイートが2020年1月から2月となっており、真冬の厳寒期(つまり釣れない月)のデータを利用していた。

そこで、今回はこの2つの課題を対処すべく、感情辞書のカスタマイズと年間を通した釣り場の感情分析にチャレンジしました!

感情分析辞書を釣り仕様にカスタマイズ!

まずは感情分析の辞書のカスタマイズからスタートして行きます!

事前にカスタマイズ前の情報を把握するため、若洲海浜公園の2019年6月のツイートのネガポジ分析をしました。

感情分析辞書のカスタマイズ前の結果(なかなかポジティブな結果です)

ここから辞書のカスタマイズを行い、結果の変遷を確認していきたいと思います。

まずはデフォルトの辞書の修正です。例えば、まったく釣れないことを表す「ボウズ」という言葉ですが、デフォルトの辞書では中立とラベルされています。

カスタマイズなしの辞書ではボウズという言葉が中立とラベリングされている

一般的な感情分析の使用用途においては中立というラベルは正解かもしれません。しかし、釣り場の評価という観点では「ネガティブ」にラベルされるべきです。このような単語を辞書から探し出し、釣り観点で正しいラベルを付与し直していきました。

次は新たな単語の追加です。

デフォルトの辞書ですと、たくさん釣れるという意味の「爆釣」が含まれていませんでした。そのため、「爆釣」のように、「バイト」「渋い」「リリース」など釣りでよく使われる言葉をトータルで20件追加していきました。

このようなカスタマイズを加え、新たに評価した結果がこちらになります!

辞書のカスタマイズ前後での結果の比較です。

補足したポジティブな単語およびネガティブな単語が増加しましたね!この結果から辞書のカスタマイズが釣り観点での単語の補足に効果があることが分かりました。

続いては、この釣り特化型の辞書を利用し、時系列評価を実施していきたいと思います!

若洲海浜公園のベストシーズンは11月?

前回の記事では期間を限定して分析を行っていたため、今回は年間を通しての分析をしていきます。

対象とするデータは、釣り場の中でもツイートが多い若洲海浜公園を利用し、月別でポジティブ/ネガティブの感情を捉えていきたいと思います!

ツイートの収集はtwitterScraperを利用しました(範囲指定してツイートを集めることができるため、めっちゃ便利です)。

収集したツイートの偏りを見てみましょう。

「若洲海浜公園+釣り」で収集したデータ

やはり5月以降のハイシーズンは釣りに関するツイートが増加し、冬になると減少していく傾向にありそうですね。

このデータを使って、釣り特化型感情辞書を利用した分析をしていきます!

若洲海浜公園の月別/ネガポジ分析結果

結果をまずポジティブ率からみていきましょう。

ポジティブ率は真冬の厳寒期である2月が最低となります。また、8月および9月でも2月並みにポジティブ率が低下しています。

2月はもちろん海水温の低下からくるものだと予想できますが、8月・9月はどうでしょうか。おそらく、2019年は記録的な猛暑のため、海水温が上がりすぎて、釣果が上がらなかったと予想されます(確かに私も釣れませんでした)。

一方で、ネガティブ率は9月・10月でピークを迎えています。9月に関しては厳しい残暑による影響、10月は混雑による不満と考えられます。

また、最もポジティブ率が高く、ネガティブ率が高いのは11月となりました。

この時期になると寒さによる混雑の解消と、残暑から解放されて釣果が増えてきたのかもしれないです!一般的にはハイシーズンとは言えない月にネガティブ/ポジティブ双方のスコアが良かったのは意外でした。

今回は若洲海浜公園のみでの分析結果でしたが、他の釣り場へ範囲を広げれば、時期によって最高の場所を特定できるかもしれないです。

また、感想にはなるのですが、辞書の拡張により分析を深めるアプローチはドメイン知識(釣りに関する知識)がないとより良いモデルが作れないと思いました。

AI活用でよく言われている、技術だけでなくドメイン知識が重要という考え方を肌身で感じることができました!

このエントリーをはてなブックマークに追加

AI×釣り」のほかの記事もどうぞ

▶ ツイートを感情分析して「良い釣り場」を探してみた
▶ 釣れなさすぎるので、AIで釣果を偽装します
▶ ワタリガニにも性格があるのか。泳ぎ方からAIで「見抜ける」


業界から探す

さらに学ぼう!

PAGE TOP