增强学习训练AI玩游戏

2024-04-08 22:49:10

1.先睹为快

左为高速学习模式，右为正常玩模式

2.游戏简介

符号A为 AI Agent。

符号@为金币，AI Agent需要尽可能的接取。

符号* 为炸弹，AI Agent需要尽可能的躲避。

游戏下方一组数字含义如下：

Bomb hit: 代表目前AI Agent所接取的炸弹数。

Coin hit: 代表目前AI Agent所接取的金币数。

Iteration：代表游戏已经进行的帧数，案例正常游玩视频，250ms一帧。高速状态下帧频未知。

Game Play：每帧会随机产生一个炸弹和一个金币，或者只产生一个炸弹或金币。每帧AI agent可以行动一次，以及所有的炸弹和金币下降一格。

当金币和炸弹到最后一格时会自动消失，此时不在参与AI Agent碰撞。

Learning Way:增强学习（之前博文已有分享）

Algorithm：Q算法（之前博文已有分享）

Game State: 本文 AI Agent 采取对其上方4*3区域进行编码。0代表没有，1代表有。那么4*3区域需要24bit的数据来表示coin 和 bomb。

当然监测区域越大状态空间就越大，那么Agent就越智能。

Game Action:左移，右移，不动。

3.具体的实现方法

3.1用hash table

用state和action特征码组合为一个唯一key，用该key为索引存储其分值。通过学习不断扩充和修改table中的数据。一段时间后table数据趋于稳定。

3.2值函数的近似

可以使用另一种方法，动作状态值函数的近似。值函数近似多用于求解连续状态集或大规模状态集。因为状态或action太多无法全部保存，所以需要抽象出一个函数，函数的参数为state和 action ，返回值为其分数。对于本文给出的小游戏，简单的使用随机梯度下降法可以对动作状态值函数进行线性近似。并可以取得较好的效果。

4.深度强化学习

这个可能是未来的方向吧。比如DeepMind的DQN。神经网络可以逼近任意复杂的值函数。这样强化学习可以学的任意复杂的规律。当然，具体研究起来肯定是很复杂的。有兴趣的读者自己去研究吧。

相关代码，已上传

https://github.com/RonTang/QLearningForAiPlayGame/

需要的同学请自行获取。

增强学习训练AI玩游戏相关推荐

从零使用强化学习训练AI玩儿游戏(3)——使用Q-learning
本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿喷. 上一篇我们已经找到 ...
从零使用强化学习训练AI玩儿游戏(1)——安装环境
本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿 ...
5月14日社区技术直播【Analytics Zoo上的分布式TensorFlow训练AI玩FIFA足球游戏】
主题: Analytics Zoo上的分布式TensorFlow训练AI玩FIFA足球游戏时间: 2020.5.14 19:00 参与方式: 扫描下方海报二维码加入钉钉群或者届时点击直播间直接观 ...
如何训练AI玩飞机大战游戏
虽然没有谷歌强大的集群和DeepMind变态的算法的团队,但基于深度强化学习(Deep Q Network DQN )的自制小游戏AI效果同样很赞.先上效果图: 下面分四个部分,具体给大家介绍. /1 ...
教ai玩游戏_简单解释：DeepMind如何教AI玩视频游戏
教ai玩游戏 by Aman Agarwal 通过阿曼·阿加瓦尔(Aman Agarwal) 简单解释:DeepMind如何教AI玩视频游戏 (Explained Simply: How DeepMi ...
在《我的世界》里教AI玩游戏，不仅建城堡还能玩分身
本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载作者:杜伟教 AI 玩游戏一直是非常有趣的研究课题,<我的世界>也成为了广大研究者的「实验田」.近日, ...
训练AI玩贪吃蛇(强化学习与Q-learning)
欢迎加入我们卧虎藏龙的python讨论qq群:729683466 ●导语 ● AI近些年发展很火不但可以下围棋还可以玩各种各样的游戏国外有人构建AI模型然后训练出了非常厉害的拳击手相信有一 ...
DeepMind训练AI玩足球，风骚走位比中国男足都强(狗头)
来源:AI科技评论本文约4200字,建议阅读9分钟本文带你了解DeepMind训练的 AI 玩足球. AI踢足球可以有多燃? 不好,对方攻到底线了!看我一脚精准拦截.抢球! 想抢回去?没门! 差点被进 ...
如何让学习python像玩游戏一样上瘾
当前AI人才极度紧缺,据<中国ICT人才生态白皮书>研究分析,到2018年底,我国人工智能人才缺口将突破100万,到2020年,这一数字将攀升到226万. 在过去的几年中,Python已经 ...
FAIR 训练 AI 玩拳击，效果堪比真人比赛，试探+周旋+爆头
来源:AI科技评论本文约2300字,建议阅读5分钟两个人工智能体学会了拳击. AI 拳击可以有多好玩? 小红红,吃我一拳. 嘿,我挡. 前期先试探周旋几次,再找机会吧. 没错,就是这个空隙,爆头. ...

最新文章

热门文章