【发布时间】:2010-09-27 03:10:12
【问题描述】:
我一直在研究分层强化学习问题,虽然许多论文提出了学习策略的有趣方法,但他们似乎都假设他们事先知道描述该领域中的动作的图结构。例如,Dietterich 的The MAXQ Method for Hierarchial Reinforcement Learning 描述了一个简单出租车领域的复杂动作和子任务图,但没有描述这个图是如何被发现的。您将如何了解此图的层次结构,而不仅仅是策略?
【问题讨论】:
-
您也可以尝试在此处发布您的问题:stats.stackexchange.com
-
我们能否对您想学习分层强化结构的场景有更多的了解?或者这是一个普遍的问题?
-
@Chris 您所说的主题可能属于 AI 规划的层次学习。相关论文是aaai.org/Papers/JAIR/Vol26/JAIR-2606.pdf(但这并不是专门针对层次学习的)。本文假设预先提供了一组原始动作(就像你提到的左移等)。这个主题很高级——有关 AI 规划的基础知识,请参阅 Russell 和 Norvig 的书。
-
我参加这个聚会有点晚了,但是如果您搜索自动归纳(或发现)MAXQ 层次结构,您会发现一些好东西。很多人都在这方面工作。
-
在我的谷歌搜索变得非常有创意之后,我终于找到了igi.tugraz.at/ril-toolbox/general/overview.html。它似乎是硕士论文的结果,是用 C++ 编写的,并且在 4 年内没有维护,但似乎包含一个使用 Taxi 域的分层强化学习示例。我无法确定它使用的是什么具体算法。
标签: artificial-intelligence machine-learning reinforcement-learning