「危険すぎる」と話題のOpenAIの文書生成ツールを悪用してみたら・・・

   

深刻なネタ不足…AIは代わりに記事を書いてくれるか?

こんにちは。釣りを趣味としながらAI開発を本業としています、つりくず(@kuzu_tsuri)です。今回も、釣りとAI開発の知見を活かした論文をご紹介します。

と、言いたいところなのですが、しばらくネタが全く思い浮かばない日々が続いていました。。。

そんな中、編集部の大嶋さんから連絡が来てしまいました。。。

編集部の大嶋
編集部の大嶋

お疲れ様です!最近、執筆の調子はいかがでしょうか?近況や執筆予定についてご連絡いただけると助かります!

急かしすぎず、柔らかい表現で進捗確認をしてくる大嶋さん。さすが編集ですね!しかし、申し訳ない気持ちはたくさんありますが、ネタが全く思い浮かばない。。。

ということで、今回はAIを使ってこの危機を乗り越えられないか、チャレンジしてみたいと思います!

文章の続きを生成してくれるAI「GPT-2」とは

「AIが勝手に記事の続きを書いてくれたら嬉しいな~」と思いながら技術調査をしていると、「GPT-2」という技術を発見しました。

この技術は、イーロン・マスクが共同会長を務める非営利組織Open AIによって発表された、自然言語の文章を生成するための技術です(技術詳細は技術論文を参照)。

書きたいテキストを入力情報として与えると、その文章の続きを自動で生成してくれるのです。そのパラメータ数は約15億個ほどあり、フェイクニュースなどに悪用されることも懸念されているようです。

そこで今回は、GTP-2をしっかり悪用し、「AI×釣り」の記事を捏造できるかチャレンジしてみたいと思います!

AI技術を悪用をする人のイメージ(Photo ACより)

検証:AIは「AI×釣り」の記事を書けるのか!?

今回は、Google Colaboratoryを利用し、GPT-2のPytorch版を以下のリポジトリからcloneしてGPT-2を試しました。

https://github.com/graykode/gpt-2-Pytorch

GPT-2を動かしてみる注意点としては、現段階では英語しか対応されていないという点です。今回は、「みらい翻訳」を利用し、私の記事のいつもの書き始め文を英訳し、この英文をもとにGPT-2に記事を書かせることにしました。

元の文章:こんにちは。釣りを趣味としながらAI開発を本業としています、つりくずです。今回も、釣りとAI開発の知見を活かして、釣りに役立ちそうなAI技術についてご紹介いたします。

英訳文:Hello. My hobby is fishing and my main job is developing AI. It’s fishing debris. In this article, we will introduce AI technology that may be useful for fishing, using our knowledge of fishing and AI development.

これで事前準備が完了です。あとはGPT-2が最初の書き始め文をよしなに解釈して、釣りとAIに関する記事をよしなに書いてくれれば、締め切りがきついときに乗り越えることができそうです!

結果:文章は生成されたが・・・

GPT-2による文章の続きを生成を実施した結果、複数の英文が得られました。

これを和訳した結果を記載していきます。

GPT-2が書いた文章
こんにちは。釣りを趣味としながらAI開発を本業としています、つりくずです。今回も、釣りとAI開発の知見を活かして、釣りに役立ちそうなAI技術についてご紹介いたします。

この記事では、AI技術について紹介し、AIの学習方法やその他の関連トピックについて学ぶことができます。

ニューラルネットワークの開発は課題となり得ます。1つ目のアプローチは、これらのニューラルネットワークを単純なタスクで訓練することです。第2のアプローチは、これらのニューラルネットワークを複雑なデータセットで訓練することです。第3のアプローチは、これらのニューラルネットワークを大規模で複雑なデータセットで訓練することです。最後に、最も一般的なアプローチは、比較的単純なデータセットでニューラルネットワークを訓練することです。このアプローチはニューラルネットワーク訓練(NN)と呼ばれ、人工知能や機械学習システムを複雑なデータセットで訓練するために使用されます。

最初のアプローチは、単純で単純なデータセットを使用してネットワークをトレーニングすることです。このアプローチは、いくつかの特徴を有し、したがって、単純なデータセットを使用することによって訓練することができる、大規模で複雑なデータセット上のAIまたは機械学習システムを訓練するために使用されています。第2のアプローチは、多くの特徴を有する複雑なデータセット上でネットワークを訓練することであり、したがって、複雑なデータセットを使用することによって訓練することができます。

なんと、最初の文章を元に、ニューラルネットワークをトレーニングするときにはデータの複雑さを変えて段階的にトレーニングをすることをオススメする記事が自動生成されました!

AIの記事という特徴は捉えられたものの、残念ながら釣りとは全く関係のない文章が生成されてしまいました。。。これでは記事が提出できそうにありません。悪用失敗です。。。

ツイートでも挑戦!

ちなみに、検証として、私の過去の釣りに関するツイートの続きをGPT-2に生成させてみた結果…

自動生成に使った元ツイート

全く関係のない意識高いツイートが生成されてしまいました。。。

生成された意識高い文章

おわりに

今回の検証では、GPT-2を用いて「AI×釣り」の文書生成に挑戦しましたが、結果としてAIに関する文章のみが生成されてしまいました。

おそらく、釣りのようなドメイン特化の文章の生成については、まだまだ学習データは少ない(というか存在しない可能性もある)ため、このような結果になったと考えられます。

とはいえ、一般的なAIの記事を書く上では、かなり高精度に書けそうな結果も得られましたので、今後は記事になり得るものが生成できるか、引き続き試していきたいと思います!

AI×釣り」のほかの記事もどうぞ

▶ 釣人「根掛かり」を攻略できるか。底生3Dモデリング
▶ 水中カメラで魚の数を検知し、釣れる日を見極める!
▶ 釣りと海洋研究を革新!魚そっくり「ロボット魚」が活躍



※この記事は公開3日後以降は無料会員限定コンテンツになります。同様に、過去の記事は全て会員のみ閲覧可能です。閲覧されたい方はこちらからご登録よろしくお願いします!


業界から探す

さらに学ぼう!

PAGE TOP