【发布时间】:2019-04-07 17:58:03
【问题描述】:
我正在尝试在基于 Pacman 的游戏中使用强化学习。我想使用 Q-learning 技术来生成代理的动作。我计划使用 openai-gym 和 keras 库来训练我的模型,但我希望有一种方法可以保存我的模型并在没有 open-gym 和 keras 库的情况下使用它(在它经过训练之后)。据我了解,Q-learning 可用于生成状态-动作对,我想知道是否可以将所有可能的组合保存到 Pacman 等可解系统中。这似乎有些不切实际,所以如果您有任何其他想法,我很想听听。
【问题讨论】:
-
使用 open.ai 健身房库或 keras 库。不过,我更喜欢 tf 和多巴胺来进行 Q 学习。使用太多的工具,一次是令人困惑的。只需关注一个状态-动作对方程并实施它。
标签: python machine-learning keras openai-gym q-learning