本質的にインタラクティブなロボット【AI論文】

★AIDB会員限定Discordを開設いたしました！ログインの上、マイページをご覧ください。

★企業と人材のマッチングサービスを準備中です。アンケートのご協力をお願いいたします！↓

強化学習

強化学習（RL）により、ロボットはフィードバックに基づいて動的環境で最適な行動戦略を学習することができることが発表された。ロボットRL中の明示的な人間のフィードバックは、明示的な報酬関数を簡単に適応できるため、有利である。しかし、人間が継続的かつ明示的にフィードバックを生成することは非常に困難で面倒なことであるため、暗黙的なアプローチの開発は非常に重要であると言える。

Su Kyoung Kimら研究者は、RLの本質的に生成された暗黙的なフィードバック（報酬）として、エラー関連電位（ErrP）、人間の脳波（EEG）のイベント関連アクティビティを使用した。

提案されたアプローチの概念。ロボットは、人間との対話を通じて最適な行動戦略を見つけようとする。ロボットは可能な行動戦略を探り、人間からフィードバック（報酬）を受け取る。ロボットの目標は、長期的に総報酬を最大化することだ。このようにして、人間は自由にジェスチャーを選択し、ロボットにフィードバックを提供しながら、ロボットは行動戦略を学習して適応させることができる。最終的に、ロボットは人間のジェスチャーの意味を暗黙的に学習する。

AIDBの全記事が読み放題のプレミアム会員登録はこちらから↓

ジェスチャー認識

本記事を読むにはAIDBのアカウントが必要です。

※ログイン/初回登録後、下記ボタンを押してください。

■サポートのお願い

AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。

産業用高速ロボット制御のための機械学習【AI論文】

AI導入に悩んだらするべき6つの良い質問　−40%のAIスタートアップがAIを使っていない事態において

AIDB

本質的にインタラクティブなロボット【AI論文】

強化学習

ジェスチャー認識

関連記事

ビールの「アルコール有無」判定（AI×食品）【論文】

「スマート製造」？人工知能の産業利用【AI論文】

高齢者の生活を守れるか。異常行動を検知するＡＩ（AI×社会）【論…

ディープラーニングが新しい「薬の使い道」を見つける（AI×医薬品…

観光客の好みをハイレベルに分析（中国）【AI論文】

おすすめ記事

「Pandasデータフレームの欠損値を確認せよ！」AIクイズ実…

「配列をpandasデータフレームにせよ！」AIクイズ実装編【…

「モデル作成後の評価法は？」AIクイズ実装編【第5問】

「scikit-learnで最小二乗法！」AIクイズ実装編【第…

「pandasでcsvファイルを読み取る！」AIクイズ実装編【…

コンテンツ検索

業界／カテゴリー

おすすめポスト

本質的にインタラクティブなロボット【AI論文】

強化学習

ジェスチャー認識

関連記事

おすすめ記事

コンテンツ検索

業界／カテゴリー

直近1か月で読まれている記事

おすすめポスト