R$ imes$R: 強化学習のための迅速な探索技術(Rapid eXploration for Reinforcement Learning via Sampling-based Reset Distributions and Imitation Pre-training)
ケントくんねえ博士、強化学習の世界でもっと早く学習できる方法ってあるの?最近のゲームでAIが上手すぎてちょっと困ってるんだよね。マカセロ博士なるほど、ケントくん。それは「R×R: Rapid eXploration for Reinforcement Learning」という視点で考える