【发布时间】:2022-08-03 11:16:12
【问题描述】:
我正在使用 Keras RL2 在自定义 openai 健身房环境中训练 DDPG 代理。对于行动空间,我正在使用这条线
self.action_space = spaces.Box(low=0, high=100, shape=(18,), dtype=np.float32)
它在训练时完全忽略了低值和高值(有时有负值和超过 200 的值)。我该如何阻止这种情况发生?
-
请提供足够的代码,以便其他人可以更好地理解或重现该问题。
标签: python reinforcement-learning openai-gym