让AI真正玩学会游戏-我的强化学习之旅

记录一下，我从百度飞桨深度学习学院《强化学习7日打卡营-世界冠军带你从零实践》，了解到的东西吧。。。

这不是按键精灵，靠颜色判断来打怪

这不是游戏辅助，用内存读写来刷图

而是真正的让AI学会玩游戏。。。

这就叫做-强化学习

强化学习（英语：Reinforcement learning，简称RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。
核心思想：智能体agent在环境environment中学习，根据环境的状态state（或观测到的observation），执行动作action，并根据环境的反馈 reward（奖励）来指导更好的动作。

让AI真正玩学会游戏-我的强化学习之旅

课程中用到的是如下利器：

让AI真正玩学会游戏-我的强化学习之旅

GYM是强化学习中经典的环境库，用到里面的CliffWalkingWapper和FrozenLake环境，为了使得环境可视化更有趣一些，可以在PARL代码库中的examples/tutorials/lesson1中下载gridworld.py使用。
PARL开源库地址：https://github.com/PaddlePaddle/PARL

让AI真正玩学会游戏-我的强化学习之旅

课程的内容如下：

让AI真正玩学会游戏-我的强化学习之旅

想学就自己去看吧。