【发布时间】:2011-07-06 21:58:23
【问题描述】:
我正在使用强化学习方法(Q、sarsa、TD(λ)、Actor-Critic、R 等)进行关于机器人感觉运动在线学习的硕士项目。我目前正在设计将使用更高级别的强化学习和更低级别的机器人 API 控制的框架。
由于状态依赖于机器人传感器并且可能(将)呈指数增长,因此我将在堆上分配它们。由于这会产生很多问题、错误等,而且由于并行化(即线程)是我想要探索的强化学习的一个方面,所以我还不确定要使用哪种智能指针。
为智能指针设计我自己的模板/类需要时间和调试,而我没有。所以,我想知道,我应该使用 STL 的auto_ptr 吗?我看到他们在向量中使用了问题。我应该使用boost::shared_ptr 吗?这些状态必须在许多类和算法之间共享。或者我应该使用boost::ptr_vector?由于状态将驻留在向量中的任务容器类中,这是否足够?状态必须是共享的、可复制的、可引用的、可序列化的、非常量的、线程安全的并且不会被删除。此外,内存空间和计算时间也很重要。
对于此类任务,您推荐什么作为最佳智能 ptr 实现?
谢谢!
看来我将不得不尝试将 boost::ptr_vector 与 class State 一起使用,如果这证明效率不高,则使用 std::vector 并启用 0X。 谢谢大家的回答和建议!
【问题讨论】:
-
不,我没有,但我会考虑使用它,我使用的是 gcc 4.5,我知道它可以启用,但有一定的限制。 0X 在这个问题上的优势是什么?
-
您可以使用
unique_ptr,它相当轻量级(比shared_ptr轻)。而且由于它是可移动构造的,我相信你甚至可以在std::vector中使用它。 -
谢谢,我会认真考虑,但由于我不知道整个项目如何启用 0X,所以我有点怀疑。
-
这是最不用担心的:将
-std=c++0x添加到您的命令行! -
与原始指针的 boost::ptr_vector 相比,使用 std::vector<:unique_ptr> 有什么优势?
标签: c++ smart-pointers reinforcement-learning