多目的報酬関数にまたがる一般化を目指す深層強化学習(Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning)
田中専務拓海さん、最近部下から「この論文を読め」と渡されたのですが、タイトルが長くて頭が痛いです。要するに何を変えた研究なのでしょうか。AIメンター拓海素晴らしい着眼点ですね!この論文は「報酬(reward)を学習アルゴリズムに渡す」という考え方で、同じ方策(policy)で複数の目的(