https://zhuanlan.zhihu.com/p/104224859?utm_oi=566394839504048128

人工智能是21世纪最激动人心的技术之一。人工智能,就是像人一样的智能,而人的智能包括感知、决策和认知(从直觉到推理、规划、意识等)。其中,感知解决what,深度学习已经超越人类水平;决策解决how,强化学习在游戏、机器人等领域取得了一定效果;认知解决why,知识图谱、因果推理、持续学习以及脑机融合等正在研究。

强化学习,采用交互试错学习的方式解决序贯决策问题,因此必然是通往通用人工智能的终极钥匙。其中,AI 1.0 符号学派, AI 2.0 联结学派,AI 3.0不管是结合也好,另辟蹊径也好,必然离不开行为学派,因为这是自然智能的学习方式。我特别喜欢强化学习,深深被其框架所吸引,智能体通过与环境交互来成长,这不就是生命的进化规律嘛!

[1]


1 视频(从入门到“放弃“)

[2]

  • 短小精悍,入门级,我的代码框架跟凡哥学的

1.2 台大_李宏毅_深度强化学习(国语)课程(2020)、PPT、笔记 ★★★★★

  • 通透,有趣,专业,启发

1.3 DeepMind_David Silver_UCL深度强化学习课程(2015)、PPT、笔记及代码

1.4 UC Berkeley_Sergey Levine_CS285(294)深度强化学习(2019)、PPT、代码

1.5 Stanford_Emma Brunskill_CS234: Reinforcement Learning | Winter 2019

2 书籍

2.1 强化学习圣经_Rich Sutton_中文书、英文电子书、代码 ★★★★★

  • 基础,难啃,经典,有助于理解强化学习精髓
强化学习路线图

2.2 深入浅出强化学习:原理入门 ★★★★★

  • 我的第一本入门书,透彻

2.3 Python深度学习:基于PyTorch[Deep Learning with Python and PyTorch] ★★★★

  • 思路简洁、清晰,内容经典、精华,深度强化学习的PyTorch深度学习基础

2.4 Python强化学习实战_Sudharsan Ravichandiran、代码 ★★★

  • 上手快,代码清晰

2.5 强化学习精要_冯超 ★★★

  • 从基础到前沿,附代码

2.6 Reinforcement Learning With Open AI TensorFlow and Keras Using Python_OpenAI

  • 注重实战(提取码: av5p)

3 教程

3.1 莫烦Python ★★★★★

  • 通俗易懂,快速入门

3.2 OpenAI Spinning Up英文版、中文版、介绍by量子位 ★★★★★

  • 字字精华,不解释,包括原理、算法、论文、代码

3.3 Stable Baselines3

  • PyTorch实现代码

4 代码

e-baselines3 ,推荐以下个人实现参考:

4.1 sweetice

  • 我很喜欢

4.2 p-christ

  • 17种经典算法

4.3 张楚珩

5 算法

强化学习路线图
强化学习路线图

三大经典算法,当然首推还是PPO(clip+gae),集大成是SAC,大规模分布式用APPO,IMPALA

5.1 DQN(连续状态、离散动作)

5.2 DDPG(连续状态、连续动作)

5.3 A3C & A2C(连续状态、连续动作)

6 环境

6.1 OpenAI Gym

6.2 Mujoco

6.3 通用格子世界环境类

7 算法库

7.1 小雅:ElegantRL

  • 轻量-高效-稳定

7.2 OpenAI Baselines & Stable Baselines

  • 集成度高,经典必读
强化学习路线图

7.3 百度 PARL

  • 扩展性强,可复现性好,支持百度AI
强化学习路线图

7.4 DeepMind OpenSpiel(仅支持Debian和Ubuntu)

  • 28种棋牌类游戏和24种算法
强化学习路线图

7.5 清华 tianshou

  • fast-speed modularized framework and pythonic API
  • 完美复现paper结果

8 论文

8.1 Spinning Up推荐论文 ★★★★★

8.2 清华张楚珩 ★★★★★

8.3 NeuronDance ★★★★

8.4 paperswithcode ★★★★

9 PPT

9.1 Reinforcement learning_Nando de Freitas_DeepMind_2019

9.2 Policy Optimization_Pieter Abbeel_OpenAI/UC Berkeley/Gradescope

10 会议&期刊

10.1 会议:NIPS、ICML、ICLR、AAAI、IJCAI、AAMAS、IROS等

10.2 期刊:AI、JMLR、JAIR、Machine Learning、JAAMAS等

10.3 计算机和人工智能会议(期刊)排名

11 公众号

11.1 深度强化学习实验室 ★★★★★

11.2 机器之心

11.3 AI科技评论

11.4 新智元

12 知乎

12.1 用户

JQWang2048 等等

12.2 专栏

David Silver强化学习公开课中文讲解及实践(叶强,比较经典)

强化学习知识大讲堂(《深入浅出强化学习:原理入门》作者天津包子馅儿)

Flood Sung:最前沿:深度强化学习的强者之路)

深度强化学习落地方法论(西交 大牛,实操经验丰富)

深度强化学习(知乎:JQWang2048,GitHub:NeuronDance,CSDN:J. Q. Wang)

神经网络与强化学习(《Reinforcement Learning: An Introduction》读书笔记)

强化学习基础David Silver笔记(陈雄辉,南大,DiDi AI Labs)

13 博客

13.1 Lil(OpenAI) ★★★★★

13.2 草帽BOY

13.3 J. Q. Wang

pilot Vision 部门主管)

13.5 Keavnn

13.6 大卜口(谷歌大脑研究科学家 David Ha)

14 官网

14.1 OpenAI

14.2 DeepMind

14.3 UC Berkeley

 

参考

  1. ^强化学习路在何方 https://mp.weixin.qq.com/s/CO4TjKbdCakxv2ldRg3cUw
  2. ^★仅代表个人喜好

相关文章:

  • 2022-12-23
  • 2021-11-24
  • 2021-12-26
  • 2021-04-16
  • 2021-07-23
  • 2021-05-26
  • 2021-05-17
猜你喜欢
  • 2021-12-02
  • 2021-12-03
  • 2022-01-13
  • 2022-02-12
  • 2021-05-30
  • 2021-12-09
  • 2021-11-23
相关资源
相似解决方案