【发布时间】:2020-05-14 02:27:09
【问题描述】:
我一直在阅读有关如何将矢量化环境与 SubProcVenv 模块一起使用的信息 来自here 和 here.
但是,我能找到的所有示例都使用稳定的基线(openai 的模型),我似乎无法找到使用我的自定义模型的方法。
可以吗?那是怎么回事?
【问题讨论】:
标签: python tensorflow keras reinforcement-learning openai-gym
我一直在阅读有关如何将矢量化环境与 SubProcVenv 模块一起使用的信息 来自here 和 here.
但是,我能找到的所有示例都使用稳定的基线(openai 的模型),我似乎无法找到使用我的自定义模型的方法。
可以吗?那是怎么回事?
【问题讨论】:
标签: python tensorflow keras reinforcement-learning openai-gym
可以按照 Colab 笔记本中的说明完成。我不确定你面临什么问题。我为自定义环境实现的方式是:
# Instantiate the env
env = customEnv()
# Wrap it
env = DummyVecEnv([lambda: env])
EPISODES = 5000
# Instantiate and learn using stable-baselines
model = PPO2('MlpPolicy', env).learn(EPISODES)
我相信您也可以为SubProcVenv 做同样的事情。如果您想使用多处理,请选择SubProcVenv仅。
【讨论】: