“如何使用Python和Keras构建自己的AlphaZero AI”中的stmemory和ltmemory

时间:2018-09-19 00:22:34

标签: python machine-learning keras deep-learning reinforcement-learning

我正在关注How to build your own AlphaZero AI using Python and Keras

git是here 在run.ipynb中,这部分代码:

memory.clear_stmemory()

if len(memory.ltmemory) >= config.MEMORY_SIZE:

帖子对此没有太多解释。 memory.ltmemorymemory.stmemory分别用来做什么?

1 个答案:

答案 0 :(得分:1)

如果您到目前为止还没有意识到,ltmemory代表长期记忆,而stmemory代表短期记忆。我还没有看过github代码,但是我对AlphaZero和强化学习如何结合在一起(自己是一名国际象棋爱好者)有基本的了解。

基本上,使AlphaZero如此强大的原因是,它像人类一样使用长期和短期记忆。通过能够根据时间局部数据(即最近发生的事件)和更多全局数据(即整个游戏及其结果)做出决策,AlphaZero能够做出不会仅在短期内有利,但从长期来看也将受益。

这有意义还是完全可以回答您的问题?我对这种输入方式进行了快速键入,并对发生的情况给出了较高层次的描述。如果您要我详细介绍一部分,请发表问题。