【发布时间】:2009-10-09 09:02:22
【问题描述】:
我必须与 Q Learning 一起做一些工作,关于一个必须在房子周围移动家具的人(基本上就是这样)。如果房子足够小,我可以有一个代表行动/奖励的矩阵,但是随着房子的大小变得越来越大,这还不够。所以我必须使用某种泛化函数来代替它。我的老师建议我不要只用一个,而是用几个,这样我就可以比较它们等等。大家有什么推荐的?
我听说对于这种情况,人们正在使用支持向量机,也就是神经网络。我不是真正的领域内,所以我不能说。我过去在神经网络方面有过一些经验,但 SVM 似乎更难掌握。还有其他我应该寻找的方法吗?我知道肯定有无数个,但我需要一些东西才能开始。
谢谢
【问题讨论】:
-
希望你不介意标记为作业。提到“老师”让我觉得很合适。
标签: language-agnostic artificial-intelligence reinforcement-learning