deep-learning - 一定次数后，深度Q-Learning Agent的性能下降 - Thinbug

一定次数后，深度Q-Learning Agent的性能下降

时间：2019-01-13 18:05:55

标签： deep-learning reinforcement-learning

我有一个DQN代理，该代理在特定的网络上受过培训以执行任务。但是，当培训代理时，我注意到在最初的次数之后，代理显示出任务分数总体上有所增长，突然之间代理的性能急剧下降，就像它重新开始一样。这发生了很多次。

我的代理显示从坏到好等的性能波动。对于DQN代理，这是正常现象吗？我应该执行什么诊断才能消除这种波动？我曾为代理使用经验重播和探索开发。我是该领域的新手，所以这个问题可能很简单。

1 个答案:

答案 0 :(得分：1)

这些波动是正常的，直到达到最佳水平。在大多数加固实验和论文中，结果以window size of 15-30的加权平均值表示。这是我的dqn实现的图。