simulink 模型上的 A3C答案

【问题标题】：A3C on simulink modelsimulink 模型上的 A3C
【发布时间】：2018-09-10 03:28:31
【问题描述】：

我目前正在我的 simulink 模型上单独运行我的深度强化学习算法。它们通过 TCP/IP 连接进行连接。 Python 向 simulink 发送动作，simulink 向 python 发送环境值。

我的问题是，我的 RL 算法经常陷入局部最小值，我认为 A3C 算法会有所帮助，因为我们同时运行多个并且通过共享内存然后避免陷入局部最小值。

但是我如何使用来自 python 的 A3C 算法运行多个 simulink 模型？我曾尝试在运行于不同 TCP/IP 端口的 simulink 上使用两种算法，但我做不到。

我也想过在 simulink 和 python 之间的 RAM 上共享内存，但我真的不知道如何执行。

如果你有更好的建议和指导来做这件事，那么我会很努力：D！

【问题讨论】：

【解决方案1】：

您可以在 python 中使用多线程来为您的每个 A3C 工作人员运行单独的 matlab 引擎。在这种情况下，您的环境应该在 python 中使用 matlab 引擎调用。

阿基尔

【讨论】：