
田中専務
拓海先生、最近部下から”オンライン強化学習(Reinforcement Learning, RL)”という話を聞くのですが、我々の現場にどれほど関係があるのか見当がつきません。論文で「サンプル複雑性」なる言葉も出てきて、どう判断すればいいのか迷っています。

AIメンター拓海
(The Sample Complexity of Online Reinforcement Learning: A Multi-model Perspective)

拓海先生、最近部下から”オンライン強化学習(Reinforcement Learning, RL)”という話を聞くのですが、我々の現場にどれほど関係があるのか見当がつきません。論文で「サンプル複雑性」なる言葉も出てきて、どう判断すればいいのか迷っています。
