GPTが「心の理論」をもつかどうかはプロンプト次第

この記事では、OpenAIの大規模言語モデル（Large Language Models: LLM）が、人間の心の理論（Theory of Mind: ToM）を理解し、推論できるかどうかを評価する研究について紹介します。心の理論とは、他者の信念や意図、感情などの精神的状態を理解する能力です。研究者たちは、適切なプロンプトがLLMの心の理論の推論能力を大幅に向上させることを示しました。

言語モデルの心の理論推論能力を探る
- 大規模言語モデルと心の理論
- 研究の目的と社会への期待

仮想的な対話を通じた心の理論の評価
- 独自の評価方法と仮想的対話シナリオ
- プロンプトの影響と効果的なコミュニケーションへの期待

GPTシリーズの心の理論推論能力の光と影
- GPT-4と人間の心の理論タスクのパフォーマンス比較
- パフォーマンス向上のためのプロンプトの工夫

未来への展望 – 心の理論の進化とAIの役割

まとめ

関連研究

参照論文情報

タイトル：Boosting Theory-of-Mind Performance in Large Language Models via Prompting

著者：Shima Rahimi Moghaddam, Christopher J. Honey（Johns Hopkins University）

URL：https://doi.org/10.48550/arXiv.2304.11490

言語モデルの心の理論推論能力を探る

大規模言語モデルと心の理論

近年、AIの分野で大きな話題を集めているのが、大規模言語モデル（LLM）です。特に、GPTシリーズはその高い文章生成能力と推論能力で広く注目を集めています。しかし、これらのモデルが「心の理論」（ToM: Theory of Mind）と呼ばれる、他者の心や意図を理解する能力を持っているのかどうかは、未だ明確には分かっていません。

心の理論は、他者とのコミュニケーションや協力行動において、人間にとって重要な役割を果たしています。もしAIがこの能力を持つことができれば、より効果的な人間とのインタラクションが期待できます。そこで、Johns Hopkins Universityの研究者らは、GPTシリーズの心の理論推論能力を調査し、適切なプロンプトによってその能力が向上するかどうかを検証しています。

研究の目的と社会への期待

研究者らの目的は、大規模言語モデルが心の理論推論能力を持っているかどうかを明らかにすることに加えて、適切なプロンプトがその能力を向上させる可能性を探ることです。また、プロンプトによるパフォーマンス向上が心の理論推論だけに限定されているのか、それとも一般的な推論タスクにも適用できるのかを明らかにすることも目指しています。

この研究結果が、適切なプロンプトが言語モデルのパフォーマンスに与える影響について新たな知見を提供し、今後のAI研究に寄与することが期待されます。