【强化学习】百度Paddle7日打卡营学习心得

【前言】

挺想为每一个课节的学习内容都做个介绍，但是最近太忙没时间弄，加上还是想后面深入理解透了再说。简单做个心得记录，顺便开个坑篇

智能的核心:与环境中交互学习
【强化学习】百度Paddle7日打卡营学习心得

环境：已知的→规划、未知的→探索和试错‘

智能体agent 在环境environment 中学习，根据环境的状态 state ，执行动作action 并根据环境的反馈 reward（奖励）来指导更好的动作
【强化学习】百度Paddle7日打卡营学习心得

【强化学习】百度Paddle7日打卡营学习心得

【强化学习】百度Paddle7日打卡营学习心得

【强化学习】百度Paddle7日打卡营学习心得

快速搭建，采用百度PARL框架
【强化学习】百度Paddle7日打卡营学习心得

（后面再开篇说）
1.基于表格型方法求解
2.基于神经网络方法
3.基于策略梯度求解
4.连续动作空间上求解

基本学习框架的主要内容差不多，感受：科科老师是我的智慧女神，讲的实在太好了，浅显易懂。适合入门有个初步把握，对于后面深入学习心里有底