从零使用强化学习训练AI玩儿游戏(1)—

本文目前主要是写给自己的一个笔记，接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏，如果能间接帮助到他人就最好不过了，不喜勿喷。

目前准备使用第一层卷积神经网络，第二层LSTM的方式通过DQN增强学习的方式来训练这个神经网络。

我是在Windows7上运行的，做完了会把代码放到GitHub上

资源：IDE：PyCharm，如果是学生的话只需要给你的学生邮箱（带edu字样）发个邮件就能使用正版了，网上还有很多破解可以自己百度。

Python环境，Anaconda，是我见过最好的Python环境了，已经集成了很多工具包，同学们可以自己百度安装使用。

Python的学习可以用这个网址。

我的Keras基础是看莫烦大神的视频学习的，讲的很好很简单。点击文字就是连接。

看了视频会发现其实搭建一个神经网络还是很简单的。接下来就需要看怎么获取游戏界面了。

开源游戏环境Gym是一个国外的开源测试平台，专门用来测试增强学习的，里面可以调用各式各样的游戏。可以通过

pip install gym

直接使用上面这个命令巨慢。。。。。使用下面这个命令加入了清华的镜像，就超级快，以后只要在使用pip安装的使用加入gym后面的清华镜像进行安装就巨快。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gym

安装，也能直接在GitHub上下载源码安装，如下图所示anaconda里安装需要在开始菜单中打开anaconda prompt再执行命令安装，看下图终点的标题。

下面来看看这个Gym是怎么玩儿的嘿嘿

# -*- coding: UTF-8 -*-if __name__ == '__main__':print('开始学习')import gymenv = gym.make('CartPole-v0')env.reset()for _ in range(1000):env.render()env.step(env.action_space.sample())  # take a random action

使用官方网址的代码可以看到这个效果：http://s3-us-west-2.amazonaws.com/rl-gym-doc/cartpole-no-reset.mp4

这个显然是没有经过控制的游戏。

还可以改变游戏名称来玩儿其他游戏，这时候发现通过pip版本能玩儿的游戏有限，使用pip install -e .[all]

注册所有游戏，再次之前需要在GitHub上下载源文件，并且通过anaconda prompt 进入到你下载的目录下执行这个命令如图

我的是下载到E:\AIGame\gym-master，下载完后看看效果，看样子下载的有点久

跑到这里发现需要安装TensorFlow，但是我这台电脑好像还没有安装，所以安装装Keras的方式装一下

到了这里发现还是有错误！！！网上查了很多资料，差点发现Windows不支持gym的其他游戏！

但是最后找到了一行命令完美解决了

pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py

用这行命令就能下载Atari的游戏了

好的！今天游戏这个阶段就准备好了~我发现要一边写博客一边开发还是一件很费时间的事情啊。。。。。。

下一篇主要看GYM给我们提供的接口，以及怎么用它

从零使用强化学习训练AI玩儿游戏(1)——安装环境相关推荐

从零使用强化学习训练AI玩儿游戏(3)——使用Q-learning
本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿喷. 上一篇我们已经找到 ...
谷歌造了个虚拟足球场，让AI像打FIFA一样做强化学习训练丨开源有API
郭一璞发自苏州街量子位报道 | 公众号 QbitAI 除了下棋.雅达利游戏和星际,AI终于把"魔爪"伸向了粉丝众多的体育竞技活动: 足球. 今天,谷歌开源了足球模拟环境G ...
基于深度强化学习训练《街头霸王·二：冠军特别版》通关关底 BOSS -智能 AI 代理项目上手
文章目录 SFighterAI项目简介实现软件环境项目文件结构运行指南环境配置验证及调整gym环境: gym-retro 游戏文件夹错误提示及解决 Could not initialize ...
利用AI强化学习训练50级比卡超单挑70级超梦！
强化学习(Reinforcement Learning, RL),是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题. ...
田渊栋的2021年终总结：多读历史！历史就是一个大规模强化学习训练集
视学算法报道作者:田渊栋编辑:好困 LRS [新智元导读]田渊栋博士最近又在知乎上发表了他的2021年度总结,成果包括10篇Paper和1部长篇小说及续集.文章中还提到一些研究心得和反思, ...
上海交大开源训练框架，支持大规模基于种群多智能体强化学习训练
机器之心专栏作者:上海交大和UCL多智能体强化学习研究团队基于种群的多智能体深度强化学习(PB-MARL)方法在星际争霸.王者荣耀等游戏AI上已经得到成功验证,MALib 则是首个专门面向 PB- ...
百度NeurIPS全球顶会冠军团队，带你7日从零实践强化学习
如今,强化学习不仅成了学术界的宠儿,相关研究论文在各大顶会中的比例飞速上升:也在不断挑战冠军,突破记录,成为了AI开发的热门领域,比如击败围棋世界冠军的Alpha Go,就引起了大家对AI的广泛关注. ...
MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。
项目设计集合(人工智能方向):助力新人快速实战掌握技能.自主完成项目设计升级,提升自身的硬实力(不仅限NLP.知识图谱.计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户 ...
基于DQN强化学习训练一个超级玛丽
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 Author:MyEncyclopedia From:MyEncy ...

从零使用强化学习训练AI玩儿游戏(1)——安装环境

从零使用强化学习训练AI玩儿游戏(1)——安装环境相关推荐

最新文章

热门文章