【发布时间】:2022-08-08 15:56:43
【问题描述】:
我是强化学习的新手,我使用 GYM 环境做了几个例子。但是,我知道并观察到强化应该在真实环境中进行训练,而不是在收集的数据(如监督学习)上进行训练,我的问题是,这总是正确的吗?我的意思是我有一个特定的数据集,它类似于推荐系统,我希望在我在真实环境中发布代理之前对代理进行训练。 这可能吗?
-
我投票结束这个问题,因为它与help center 中定义的编程无关
标签: deep-learning reinforcement-learning openai-gym