【发布时间】:2018-09-10 03:28:31
【问题描述】:
我目前正在我的 simulink 模型上单独运行我的深度强化学习算法。它们通过 TCP/IP 连接进行连接。 Python 向 simulink 发送动作,simulink 向 python 发送环境值。
git:https://github.com/qLience/eligibility_pump
我的问题是,我的 RL 算法经常陷入局部最小值,我认为 A3C 算法会有所帮助,因为我们同时运行多个并且通过共享内存然后避免陷入局部最小值。
但是我如何使用来自 python 的 A3C 算法运行多个 simulink 模型?我曾尝试在运行于不同 TCP/IP 端口的 simulink 上使用两种算法,但我做不到。
我也想过在 simulink 和 python 之间的 RAM 上共享内存,但我真的不知道如何执行。
如果你有更好的建议和指导来做这件事,那么我会很努力:D!
【问题讨论】:
标签: python parallel-processing simulink reinforcement-learning