【问题标题】:A3C on simulink modelsimulink 模型上的 A3C
【发布时间】:2018-09-10 03:28:31
【问题描述】:

我目前正在我的 simulink 模型上单独运行我的深度强化学习算法。它们通过 TCP/IP 连接进行连接。 Python 向 simulink 发送动作,simulink 向 python 发送环境值。

git:https://github.com/qLience/eligibility_pump

我的问题是,我的 RL 算法经常陷入局部最小值,我认为 A3C 算法会有所帮助,因为我们同时运行多个并且通过共享内存然后避免陷入局部最小值。

但是我如何使用来自 python 的 A3C 算法运行多个 simulink 模型?我曾尝试在运行于不同 TCP/IP 端口的 simulink 上使用两种算法,但我做不到。

我也想过在 simulink 和 python 之间的 RAM 上共享内存,但我真的不知道如何执行。

如果你有更好的建议和指导来做这件事,那么我会很努力:D!

【问题讨论】:

    标签: python parallel-processing simulink reinforcement-learning


    【解决方案1】:

    您可以在 python 中使用多线程来为您的每个 A3C 工作人员运行单独的 matlab 引擎。在这种情况下,您的环境应该在 python 中使用 matlab 引擎调用。

    阿基尔

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-05-31
      • 1970-01-01
      • 1970-01-01
      • 2014-02-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多