前言
将莫烦python强化学习中提及算法的【伪代码】汇总起来,方便复习。
1、Q_Learning

2、Sarsa

3、Sarsa_Lambda

4、DQN

5、Double_DQN

6、暂无Dueling_DQN
7、Prioritized_DQN

8、Policy_Gradients

9、暂无Actor_Critic
10、DDPG

11、A3C

12、OpenAI_PPO

13、DeepMind_PPO

相关文章:
-
2021-09-04
-
2021-05-15
-
2021-11-30
-
2021-11-25
-
2021-12-21
-
2022-12-23
-
2021-12-19
-
2021-09-17