2D射击游戏的状态表示

时间:2019-01-23 16:35:34

标签: reinforcement-learning

我正在尝试通过强化学习使计算机学习一个非常简单的2D射击游戏。具体来说-使用DQN。首先,我希望我的经纪人杀死一名留在原地的球员。我给他每个时间步长的奖励为-1。但是,我真的不知道如何设计状态表示。

游戏: 5 x 5平方。 2名玩家各占一平方。 1英寸(0,0)和2英寸(4,4)。他们都可以直线射击。当玩家射击时,子弹会朝着玩家移动时设定的方向移动(开始时,玩家1设置为右,而玩家2设置为左)。

原始像素不好,因为探员看不到子弹的前进方向。

任何建议将不胜感激。

Image of the game

0 个答案:

没有答案