1.先睹为快

左为高速学习模式,右为正常玩模式

2.游戏简介

符号A为 AI Agent。

符号@为金币,AI Agent需要尽可能的接取。

符号* 为炸弹,AI Agent需要尽可能的躲避。

游戏下方一组数字含义如下:

Bomb hit: 代表目前AI Agent所接取的炸弹数。

Coin hit:   代表目前AI Agent所接取的金币数。

Iteration:代表游戏已经进行的帧数,案例正常游玩视频,250ms一帧。高速状态下帧频未知。

Game Play:每帧会随机产生一个炸弹和一个金币,或者只产生一个炸弹或金币。每帧AI agent可以行动一次, 以及所有的炸弹和金币下降一格。

当金币和炸弹到最后一格时会自动消失,此时不在参与AI Agent碰撞。

Learning Way:增强学习(之前博文已有分享)

Algorithm:Q算法(之前博文已有分享)

Game State: 本文 AI Agent 采取对其上方4*3区域进行编码。0代表没有,1代表有。那么4*3区域需要24bit的数据来表示coin 和 bomb。

当然监测区域越大状态空间就越大,那么Agent就越智能。

Game Action:左移,右移,不动。

3.具体的实现方法

3.1用hash table

用state和action特征码组合为一个唯一key,用该key为索引存储其分值。通过学习不断扩充和修改table中的数据。一段时间后table数据趋于稳定。

3.2值函数的近似

可以使用另一种方法,动作状态值函数的近似。值函数近似多用于求解连续状态集或大规模状态集。因为状态或action太多无法全部保存,所以需要抽象出一个函数,函数的参数为state和 action ,返回值为其分数。对于本文给出的小游戏,简单的使用随机梯度下降法可以对动作状态值函数进行线性近似。并可以取得较好的效果。

4.深度强化学习

这个可能是未来的方向吧。 比如DeepMind的DQN。神经网络可以逼近任意复杂的值函数。这样强化学习可以学的任意复杂的规律。当然,具体研究起来肯定是很复杂的。有兴趣的读者自己去研究吧。

相关代码,已上传

https://github.com/RonTang/QLearningForAiPlayGame/

需要的同学请自行获取。

增强学习训练AI玩游戏相关推荐

  1. 从零使用强化学习训练AI玩儿游戏(3)——使用Q-learning

    本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿喷. 上一篇我们已经找到 ...

  2. 从零使用强化学习训练AI玩儿游戏(1)——安装环境

                本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿 ...

  3. 5月14日社区技术直播【Analytics Zoo上的分布式TensorFlow训练AI玩FIFA足球游戏】

    主题: Analytics Zoo上的分布式TensorFlow训练AI玩FIFA足球游戏 时间: 2020.5.14 19:00 参与方式: 扫描下方海报二维码加入钉钉群 或者 届时点击直播间直接观 ...

  4. 如何训练AI玩飞机大战游戏

    虽然没有谷歌强大的集群和DeepMind变态的算法的团队,但基于深度强化学习(Deep Q Network DQN )的自制小游戏AI效果同样很赞.先上效果图: 下面分四个部分,具体给大家介绍. /1 ...

  5. 教ai玩游戏_简单解释:DeepMind如何教AI玩视频游戏

    教ai玩游戏 by Aman Agarwal 通过阿曼·阿加瓦尔(Aman Agarwal) 简单解释:DeepMind如何教AI玩视频游戏 (Explained Simply: How DeepMi ...

  6. 在《我的世界》里教AI玩游戏,不仅建城堡还能玩分身

    本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载 作者:杜伟 教 AI 玩游戏一直是非常有趣的研究课题,<我的世界>也成为了广大研究者的「实验田」.近日, ...

  7. 训练AI玩贪吃蛇(强化学习与Q-learning)

    欢迎加入我们卧虎藏龙的python讨论qq群:729683466 ●导 语 ● AI近些年发展很火 不但可以下围棋 还可以玩各种各样的游戏 国外有人构建AI模型 然后训练出了非常厉害的拳击手 相信有一 ...

  8. DeepMind训练AI玩足球,风骚走位比中国男足都强(狗头)

    来源:AI科技评论本文约4200字,建议阅读9分钟本文带你了解DeepMind训练的 AI 玩足球. AI踢足球可以有多燃? 不好,对方攻到底线了!看我一脚精准拦截.抢球! 想抢回去?没门! 差点被进 ...

  9. 如何让学习python像玩游戏一样上瘾

    当前AI人才极度紧缺,据<中国ICT人才生态白皮书>研究分析,到2018年底,我国人工智能人才缺口将突破100万,到2020年,这一数字将攀升到226万. 在过去的几年中,Python已经 ...

  10. FAIR 训练 AI 玩拳击,效果堪比真人比赛,试探+周旋+爆头

    来源:AI科技评论本文约2300字,建议阅读5分钟 两个人工智能体学会了拳击. AI 拳击可以有多好玩? 小红红,吃我一拳. 嘿,我挡. 前期先试探周旋几次,再找机会吧. 没错,就是这个空隙,爆头. ...

最新文章

  1. 在Yolov5 Yolov4 Yolov3 TensorRT 实现Implementation
  2. mysql8.11安装_MySQL-mysql 8.0.11安装教程
  3. Kotlin学习 PART 2:kotlin基础
  4. Flutter学习记录(三、Flutter项目学习navBar的使用)
  5. XMLHTTP.readyState的五种状态
  6. Java:汇总堆外数据
  7. Python+Selenium学习笔记10 - send_keys上传文件
  8. 第65课 采访报道 《小学生C++趣味编程》
  9. Python 语法糖
  10. Android Audio Focus的应用(requestAudioFocus)
  11. 使用hiredis接口(Synchronous API)编写redis流水线客户端
  12. Dubbo + Zookeeper入门初探(转载)
  13. winformlabel自动换行
  14. mysql中B+树索引原理
  15. 二元二次方程例题_二元二次方程组 解法 例题
  16. 数码相机SD卡无法读取怎么办?照片怎么恢复
  17. 【不仅仅是程序员】——公司的沉淀是什么(2)
  18. E4A影视APP源码电视盒子酷点TV版4.5 后端对接苹果cms
  19. python中def main是什么意思_浅析Python中的main函数
  20. Win10 按键精灵 抓不到正确坐标的解决办法

热门文章

  1. 计算机怎么查文件打印记录表,打印机历史记录
  2. UA MATH523A 实分析3 积分理论17 Fubini-Tonelli定理
  3. 计算机英语第一张思维导图,英语语法快速入门1-简单句(附思维导图) - 小黑电脑...
  4. matlab 绘制对数曲线图,大神经验!教你用matlab画对数坐标!
  5. Html中的favicon ico
  6. 肠道菌群失调是II型糖尿病和炎症性肠病的标志物
  7. Linux必会的rpm命令安装软件
  8. 「How The Economic Machine Works」《经济机器是如何运转的》中文字幕
  9. 分号在各种编程语言中的作用
  10. 软件架构之前后端分离与前端模块化发展史