记录一下,我从百度飞桨深度学习学院 《强化学习7日打卡营-世界冠军带你从零实践》,了解到的东西吧。。。
这不是按键精灵,靠颜色判断来打怪
这不是游戏辅助,用内存读写来刷图
而是真正的让AI学会玩游戏。。。
这就叫做-强化学习
什么是强化学习
- 强化学习(英语:
Reinforcement learning,简称RL)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。 - 核心思想:智能体
agent在环境environment中学习,根据环境的状态state(或观测到的observation),执行动作action,并根据环境的反馈reward(奖励)来指导更好的动作。
课程中用到的是如下利器:
-
GYM是强化学习中经典的环境库,用到里面的CliffWalkingWapper和FrozenLake环境,为了使得环境可视化更有趣一些,可以在PARL代码库中的examples/tutorials/lesson1中下载gridworld.py使用。 -
PARL开源库地址:https://github.com/PaddlePaddle/PARL
课程的内容如下:
链接在这里:https://aistudio.baidu.com/aistudio/education/group/info/1335
想学就自己去看吧。