tianqianlan

深度强化学习入门笔记

一、深度强化学习( DRLDRLDRL)

传统强化学习:真实环境中的状态数目过多,求解困难。
深度强化学习:将深度学习和强化学习结合在一起,通过深度神经网络直接学习环境(或观察)与状态动作值函数Q(s,a)之间的映射关系,简化问题的求解

Deep Q Network(DQN)

Deep Q Network(DQN):是将神经网络(neural network)和Q-1earning结合,利用神经网络近似模拟函数Q(s,a),输入是问题的状态(e.g.,图形),输出是每个动作a对应的Q值,然后依据Q值大小选择对应状态执行的动作,以完成控制。
神经网络的参数:应用监督学习完成

DQN学习过程

    

 

DQN算法流程

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

发表于 2020-02-07 00:33  白包子  阅读(162)  评论(0编辑  收藏  举报
 

分类:

技术点:

相关文章:

  • 2021-12-02
  • 2021-04-24
  • 2021-05-25
  • 2021-06-15
  • 2021-11-28
  • 2021-12-13
  • 2022-01-22
  • 2021-12-13
猜你喜欢
  • 2021-12-02
  • 2021-07-10
  • 2021-04-21
  • 2021-04-08
  • 2021-05-29
  • 2021-09-16
  • 2021-09-06
相关资源
相似解决方案