记录一下,我从百度飞桨深度学习学院 《强化学习7日打卡营-世界冠军带你从零实践》,了解到的东西吧。。。

 

这不是按键精灵,靠颜色判断来打怪

这不是游戏辅助,用内存读写来刷图

而是真正的让AI学会玩游戏。。。

这就叫做-强化学习

什么是强化学习

  • 强化学习(英语:Reinforcement learning,简称RL)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。
  • 核心思想:智能体agent在环境environment中学习,根据环境的状态state(或观测到的observation),执行动作action,并根据环境的反馈 reward(奖励)来指导更好的动作。

让AI真正玩学会游戏-我的强化学习之旅

课程中用到的是如下利器:

 

 

让AI真正玩学会游戏-我的强化学习之旅

让AI真正玩学会游戏-我的强化学习之旅

  • GYM是强化学习中经典的环境库,用到里面的CliffWalkingWapperFrozenLake环境,为了使得环境可视化更有趣一些,可以在PARL代码库中的examples/tutorials/lesson1中下载gridworld.py使用。

  • PARL开源库地址:https://github.com/PaddlePaddle/PARL

让AI真正玩学会游戏-我的强化学习之旅

 

让AI真正玩学会游戏-我的强化学习之旅

课程的内容如下:

让AI真正玩学会游戏-我的强化学习之旅

链接在这里:https://aistudio.baidu.com/aistudio/education/group/info/1335

想学就自己去看吧。

相关文章: