二重逐次過緩和Q学習と深層強化学習への拡張(Double Successive Over-Relaxation Q-Learning with an Extension to Deep Reinforcement Learning)
田中専務拓海先生、最近部下から「Q学習の改良で収束が早くなる論文が出ました」と聞きまして、正直ピンと来ないのです。要するにうちの現場で役に立つ話でしょうか。AIメンター拓海素晴らしい着眼点ですね!今回の論文は、強化学習(Reinforcement Learning、RL)で使うQ学習(Q