本質的にインタラクティブなロボット【AI論文】

強化学習

強化学習(RL)により、ロボットはフィードバックに基づいて動的環境で最適な行動戦略を学習することができることが発表された。 ロボットRL中の明示的な人間のフィードバックは、明示的な報酬関数を簡単に適応できるため、有利である。 しかし、人間が継続的かつ明示的にフィードバックを生成することは非常に困難で面倒なことであるため、暗黙的なアプローチの開発は非常に重要であると言える。

Su Kyoung Kimら研究者は、RLの本質的に生成された暗黙的なフィードバック(報酬)として、エラー関連電位(ErrP)、人間の脳波(EEG)のイベント関連アクティビティを使用した。

提案されたアプローチの概念。ロボットは、人間との対話を通じて最適な行動戦略を見つけようとする。ロボットは可能な行動戦略を探り、人間からフィードバック(報酬)を受け取る。ロボットの目標は、長期的に総報酬を最大化することだ。このようにして、人間は自由にジェスチャーを選択し、ロボットにフィードバックを提供しながら、ロボットは行動戦略を学習して適応させることができる。最終的に、ロボットは人間のジェスチャーの意味を暗黙的に学習する。

ジェスチャー認識

このコンテンツを閲覧するには無料会員ログインが必要です。会員の方はログインして下さい。
新規無料会員登録はこちら

PAGE TOP