【前言】

挺想为每一个课节的学习内容都做个介绍,但是最近太忙没时间弄,加上还是想后面深入理解透了再说。简单做个心得记录,顺便开个坑篇

【认识强化学习】

智能的核心:与环境中交互学习
【强化学习】百度Paddle7日打卡营学习心得

像人一样的自学?

环境:已知的→规划、未知的→探索和试错‘

核心思想:

智能体agent 在环境environment 中学习,根据环境的状态 state ,执行动作action 并根据环境的反馈 reward(奖励)来指导更好的动作
【强化学习】百度Paddle7日打卡营学习心得

强化学习和其他机器学习关系

【强化学习】百度Paddle7日打卡营学习心得

Agent学习的两种方案

【强化学习】百度Paddle7日打卡营学习心得

RL经典模型

【强化学习】百度Paddle7日打卡营学习心得

Agent 与 environment进行交互的方法

快速搭建,采用百度PARL框架
【强化学习】百度Paddle7日打卡营学习心得

求解RL方法

(后面再开篇说)
1.基于表格型方法求解
2.基于神经网络方法
3.基于策略梯度求解
4.连续动作空间上求解

基本学习框架的主要内容差不多,感受:科科老师是我的智慧女神,讲的实在太好了,浅显易懂。适合入门有个初步把握,对于后面深入学习心里有底

相关文章: