
田中専務
拓海先生、最近部下から”オンライン強化学習(Reinforcement Learning, RL)”という話を聞くのですが、我々の現場にどれほど関係があるのか見当がつきません。論文で「サンプル複雑性」なる言葉も出てきて、どう判断すればいいのか迷っています。

AIメンター拓海
素晴らしい着眼点ですね!大丈夫です、田中専務。まずは結論だけ簡潔にお伝えしますと、この研究は未知の連続的な動的システムを制御する際の

拓海先生、最近部下から”オンライン強化学習(Reinforcement Learning, RL)”という話を聞くのですが、我々の現場にどれほど関係があるのか見当がつきません。論文で「サンプル複雑性」なる言葉も出てきて、どう判断すればいいのか迷っています。

素晴らしい着眼点ですね!大丈夫です、田中専務。まずは結論だけ簡潔にお伝えしますと、この研究は未知の連続的な動的システムを制御する際の