単一デモンストレーション模倣学習のための専門家近接を代理報酬として用いる(Expert Proximity as Surrogate Rewards for Single Demonstration Imitation Learning)
田中専務拓海先生、最近部下から「単一デモで学べるAIだ」とか聞いたのですが、要するに専門家が一回やって見せたらロボットが覚えるという話ですか。うちの現場でも使えるものでしょうか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、要点を先に言うと、今回の研究は「専門家の一回の行動から学ぶ」状