REPLACE_ME
1未満 分で読了
0 views
異種エージェント環境における単調改善の改良 — Optimal Marginal Deterministic Policy Gradient(OMDPG) / Improving monotonic optimization in heterogeneous multi-agent reinforcement learning with optimal marginal deterministic policy gradient
監修者
阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授
論文研究シリーズ
AI技術革新 - 人気記事
PCも苦手だった私が


