「TweetからTweet主の人物像を当てる」現場にコミットする機械学習ノート【vol.21】

2020/9/10
論文
小原大智

★AIDB会員限定Discordを開設いたしました！ログインの上、マイページをご覧ください。

★企業と人材のマッチングサービスを準備中です。アンケートのご協力をお願いいたします！↓

こんにちは。エンジニアライターの小原です。

連載「現場にコミットする機械学習ノート」では、論文を詳しく読み解きながら、現場で使えるAI実装のヒントを記録していきたいと思います。

AIDBの全記事が読み放題のプレミアム会員登録はこちらから↓

前回の記事では、「決定木で地表の水を見つける」を扱いました。

今回は、スロベニアのJožef Stefan InstituteのM. MartincらがCLEF 2019で発表した「ツイート主をツイートからプロファイリングする」に関する論文を扱っていきます。

もくじ
1章　著者プロファイリングの可能性
2章　ロジスティクス回帰でツイートからツイート主をプロファイリングする
2.1　研究目的：性別、年齢、知名度、職業を当てる
2.2　研究手法：「n-gram特徴量」を使用
2.3　研究結果：複数モデルを検証するとロジスティック回帰の優位性が現れた

■前回の記事：【vol.20】決定木で地表の水を見つける

1章
著者プロファイリングの可能性

著者プロファイリング（AP）とは、その人が作成した文章に基づいて、その人の人口統計学的特徴や心理的特徴を学習することを扱う分野です。この分野で最も一般的な作業は、性別、年齢、言語などについての予測です。

作成した文章からその人の特徴を上手く推測することができる技術があれば、webマーケティングや保険業など多くのビジネス領域において活用できるのではないでしょうか。

そこでスロベニアのM. Martincらは、ツイートからツイート主のプロファイリングを行うことに挑戦しました。

2章
ロジスティック回帰でツイートからツイート主をプロファイリングする

まずはM. Martincらの研究におけるミッション・手法・結果をまとめます。

本記事を読むにはAIDBのアカウントが必要です。

※ログイン/初回登録後、下記ボタンを押してください。

■サポートのお願い

AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。

思い出の写真に「いなかったはず」の人物を挿し込むAI技術、発表【CVPR2020】

3Dで人体のポーズを捉える新しい汎用AIシステム登場【GitHub】

AIDB