如何用人工智能自动玩游戏

一、前言

让AI玩游戏的思想早在上世纪就已经有了,那个时候更偏向棋类游戏。像是五子棋、象棋等。在上世纪“深蓝”就击败了国际象棋冠军,而到2016年“Alpha Go”击败了人类围棋冠军。

到现在,AI涉略的不仅仅是棋类游戏。像是超级马里奥、王者荣耀这种游戏,AI也能有比较好的表现。今天我们就来用一个实际的例子讨论AI自动玩游戏这一话题,本文会用非常简单的机器学习算法让AI自动玩Google小恐龙游戏。

二、Google小恐龙与监督学习

2.1、Google小恐龙

如果你使用的是Chrome浏览器,那么相信你应该见过下面这个恐龙:


当我们用Chrome断网访问网页时,就会显示这个恐龙,或者直接在地址栏输入:chrome://dino直接访问该游戏。

游戏的玩法非常简单,只需要按空格键即可。比如下面左图,快碰到障碍物,这时需要按空格,而下面右图没有障碍(或离障碍比较远),则不需要按按键。


当然还有出现鸟的情况,我们也可以归为跳的情况。大家可以玩一下。

2.2、监督学习

玩游戏很多时候会使用一个叫强化学习的方式来实现,而本文使用比较简单的监督学习来实现。

本文会使用逻辑回归算法实现,其代码如下:

from sklearn.linear_model import LogisticRegression # 逻辑回归模型
from sklearn.model_selection import train_test_split    # 数据集拆分
# 1、准备数据
X = [# 天河区的坐标[1, 1],[1, 2],[2, 0],[3, 2],[3, 3],# 花都区的坐标[7, 7],[6, 7],[7, 6],[8, 6],[8, 5]
]
y = [0, 0, 0, 0, 0, 1, 1, 1, 1, 1]
# 2、拆分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 3、定义模型
model = LogisticRegression()
# 4、填充数据并训练
model.fit(X_train, y_train)
# 5、评估模型
score1 = model.score(X_train, y_train)
score2 = model.score(X_test, y_test)
print(score1, score2)
# 6、预测
input = [[4, 4]
]
pred = model.predict(input)
print(pred)

关于逻辑回归的讲解可以查看:Python快速构建神经网络

我们可以把玩游戏看作一个分类问题,即输入为当前游戏的图像,输出为0、1的一个二分类问题(0表示跳,1表示不跳)。要让AI实现自动玩游戏,我们需要做几件事情。分别如下:

  1. 玩游戏,收集一些需要跳的图片和一些不需要条的图片
  2. 选择合适的分类算法,训练一个模型
  3. 截取当前游戏画面,预测结果,判断是否需要跳跃
  4. 如果需要跳跃,则用程序控制键盘,按下跳跃键

下面我们来依次完成上面的事情。

三、收集数据

收集数据我们需要在玩游戏的过程中不停地截图,这里可以用Pillow模块来实现截图。Pillow模块需要单独安装,安装语句如下:

pip install pillow

截图的代码如下:

import time
from PIL import ImageGrab   # 截图
time.sleep(3)
while True:# 截图img = ImageGrab.grab()# print(img.size) # 960 540 480 270img = img.resize((960, 540))# 保存图片img.save(f'imgs/{str(time.time())}.jpg')# 修改nametime.sleep(0.1)

运行程序后就可以切换到Chrome开始游戏了。进行一段时间后,我们会截取一些图片,大致如下:

这时就轮到人类智能上场了,我们手动的把我们决定需要跳的场景放置到imgs/jump目录下,把觉得不需要跳的场景放到imgs/none目录下。然后就可以进行下一步了,这里截取的图片通常不需要跳的要多很多,所有可以多收集几次。

收集完成后我们就可以把图片读入,并转换成一个1维数组,这部分代码如下:

import os
import cv2
# 所有图片的全路径
files = [os.path.join(jump_path, jump) for jump in os.listdir(jump_path)] + \[os.path.join(none_path, none) for none in os.listdir(none_path)]
X = []
y = [0] * len(os.listdir(jump_path)) + [1] * len(os.listdir(none_path))
# 遍历jump目录下的图片
for idx, file in enumerate(files):filepath = os.path.join(none_path, file)x = cv2.imread(filepath, 0).reshape(-1)X.append(x)

此时Xy就是我们的特征和目标了。有了Xy就可以开始训练模型了。

四、训练分类模型

训练部分的代码非常简单,我们可以在训练完成后保存模型。代码如下:

import os
import cv2
import joblib
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
jump_path = os.path.join('imgs', 'jump')    # 需要跳的图片的根目录
none_path = os.path.join('imgs', 'none')    # 不需要跳的图片的根目录
# 所有图片的全路径
files = [os.path.join(jump_path, jump) for jump in os.listdir(jump_path)] + \[os.path.join(none_path, none) for none in os.listdir(none_path)]
X = []
y = [0] * len(os.listdir(jump_path)) + [1] * len(os.listdir(none_path))
# 遍历jump目录下的图片
for file in files:x = cv2.imread(file, 0).reshape(-1)X.append(x)# 2、拆分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 3、定义模型
model = LogisticRegression(max_iter=500)
# 4、训练模型
model.fit(X_train, y_train)
# 5、评估模型
train_score = model.score(X_train, y_train)
test_score = model.score(X_test, y_test)
print(train_score, test_score)
# 保存模型
joblib.dump(model, 'auto_play.m')

在我电脑上训练的准确率在90%以上,总体效果还是不错的。不过有几个可以改进的地方。这里说几点:

  1. 图像只有中间部分会对下一步操作有影响,因此可以选择对训练图片进行一些处理。把上面和下面部分设置为0。如果做了这个处理,那么在实际应用时也要做同样的处理。
  2. 这些图片如果移植到其它电脑可能不适用,因为分辨率等原因。所有可以选择使用更复杂的模型,比如CNN网络。
  3. 因为手动收集数据比较麻烦,可以选择做一下数据增强。

在这里我们不做这些改进,直接使用最简单的模型。

五、自动玩游戏

自动玩游戏需要借助pynput模块来实现,其安装如下:

pip install pynput

我们可以用下面的代码实现按下键盘的空格键:

from pynput import keyboard
from pynput.keyboard import Key
# 创建键盘
kb = keyboard.Controller()
# 按下空格键
kb.press(Key.space)

知道了如何控制键盘后,我们就可以使用模型截取预测,如何判断是否要按空格,代码如下:

import time
import cv2
import joblib
import numpy as np
from PIL import ImageGrab
from pynput import keyboard
from pynput.keyboard import Keytime.sleep(3)
# 0、创建键盘
kb = keyboard.Controller()
# 1、加载模型
model = joblib.load('auto_play.m')
while True:# 2、准备数据ImageGrab.grab().resize((960, 540)).save('current.jpg')  # 保存当前屏幕截屏x = cv2.imread('current.jpg', 0).reshape(-1)x = [x]# 3、预测pred = model.predict(x)print(pred)# 如果需要跳,则按下空格if pred[0] == 0:kb.press(Key.space)

运行上面的程序后,打开浏览器即可开始游戏。程序的代码和图片文件:https://download.csdn.net/download/ZackSock/86543410
GitHub地址为:https://github.com/IronSpiderMan/AutoPlayGoogleDino

如何用人工智能自动玩游戏相关推荐

  1. 看DeepMind如何用Reinforcement learning玩游戏

    看DeepMind如何用Reinforcement learning玩游戏 说到机器学习最酷的分支,非Deep learning和Reinforcement learning莫属(以下分别简称DL和R ...

  2. python创始人游戏_李总为AI湿身,而5118老板连夜教你Python写AI自动玩游戏,快搬凳...

    5118 Python公开课 昨天在百度AI开发者大会现场,正当李彦宏在现场讲解百度无人驾驶汽车自动泊车时,一名不明人士冲向演讲台并向他泼洒不名液体.李彦宏没有停止演讲,并在现场表示:"大家 ...

  3. python 游戏辅助lol_一个基于python的自动玩游戏辅助

    文章目录 一.背景 场景分析 二.方案选择 方案对比: 三.设计思路 四.代码撸起来 五.工具效果 我的心得 一.背景 业余时间我会玩一玩游戏,然而并不是所有所有的游戏内容都会让我一直保持着兴趣.一段 ...

  4. python自动玩游戏_超牛!用Python自动玩转2048游戏

    本篇作者:BlueDamage 近来在折腾selenium自动化, 感觉配合爬虫很有意思, 大多数以前难以模拟登录的网站都可以爬了,折腾了这么久, 于是想自动玩个2048游戏!嘿嘿, 我是一个不擅长玩 ...

  5. 【普通玩家VS高手玩家】一带传奇游戏《俄罗斯方块儿》新作—实现AI自动玩游戏~

    导语 提到<俄罗斯方块>(Tetris),那真是几乎无人不知无人不晓. ​ 其历史之悠久,可玩性之持久,能手轻轻一挥,吊打一大波游戏. 对于绝大多数小友而言,<俄罗斯方块>的规 ...

  6. 深度学习算法(第37期)----如何用强化学习玩游戏?

    上期我们一起学习了强化学习中的时间差分学习和近似Q学习的相关知识, 今天我们一起用毕生所学来训练一个玩游戏的AI智能体. 由于我们将使用 Atari 环境,我们必须首先安装 OpenAI gym 的 ...

  7. Python:看我如何全程自动玩游戏带你飞,直接无敌

    前言 最近我小表妹迷上了玩连连看,玩了一个星期了还没通关,真的是菜. 我实在是看不过去了,直接用python写了个脚本代码,一分钟一把游戏. 快是快,就是联网玩容易被骂,嘿嘿~ 但是,又不是我玩,有什 ...

  8. tensorflow2.0 dqn 深度强化学习 AI自动玩游戏,有详细注解

    有人看文章后半部分代码是空的,其实是博客的字变黑了.我不知道这个怎么回事,没检查出语法问题.所以只要你把空白的部分一起复制就能看到所有的代码了!! 准备环境 安装python 游戏包 pip inst ...

  9. 微信小程序 最强连一连攻略 程序自动玩 续集

    背景 前段时间,闲暇时间玩了微信中的一款游戏叫 最强连一连,玩了一段时间发现手动去玩不知道要玩几个月,于是就开始各种找资料.找了几个代码,最终找到这个 大神的代码,他写了一篇文章叫 <微信小程序 ...

  10. 听说这个软件可以基于图片编程玩游戏?

    接上篇:一个基于python的自动玩游戏辅助 ProcessOn是一款非常好用的思维导图.流程图在线作图工具,前10位使用我的专属邀请链接注册Processon,并成功给我增加3个文件的朋友,将赠送永 ...

最新文章

  1. palapaweb怎样开启服务_过年期间如何做到系统服务安全运行?
  2. 【 FPGA 】MATLAB 生成 FIR 滤波器的操作步骤(包括生成Verilog HDL代码以及仿真过程)
  3. RBF网络——核心思想:把向量从低维m映射到高维P,低维线性不可分的情况到高维就线性可分了...
  4. python中所有保留字首字母都是小写_int是不是python的保留字
  5. sql server系统表详细说明(二)(摘)
  6. 手把手教你Homestead安装,并填坑!!
  7. DirectShow组件原理分析及应用
  8. C#使用并行任务库(TPL)
  9. 排序趟[置顶] Java和C实现的冒泡排序(基本思想)
  10. fscanf、fprintf的返回值
  11. xamarin android 设备,【Xamarin.Android】在Visual Studio中增强设备日志记录
  12. springboot项目引入图片_SpringBoot集成阿里云OSS图片上传
  13. JAVA实现网页版斗地主_Java实现斗地主最简代码实例
  14. usb声卡驱动_香蕉猴Monkeybanana Hapa系列USB麦克风 测评
  15. 克罗内克张量积 Kron 的 OpenCV C++实现
  16. 计算机键盘锁不了怎么办,笔记本电脑键盘没反应是哪个键锁了?该怎么办
  17. 猜拳游戏(C语言-Linux-简单可视化)
  18. 代码随想录第七天 LeetCode 454、383、15、18 (哈希表、双指针)
  19. 关于contiki中的Ctimer和Etimer
  20. 【Python】Decision on buying cars COROLLA or LEVIN(数据分析技术实现过程之·2 data_analysis①)

热门文章

  1. 每日启程——2019年12月10日(敏不有初,鲜克以终)
  2. 啸叫抑制(howling suppression)
  3. HDU 4415 Assassin's Creed(贪心)
  4. 数据库系统原理与应用教程(041)—— MySQL 查询(三):设置查询条件
  5. Go 每日一库之 roaring
  6. 大厂面试预备篇——《两万字MySql基础总结》❤️建议收藏
  7. python 股票分析_Python 股票分析入门
  8. 【传感器大赏】80cm红外距离传感器
  9. BZOJ-USACO被虐记
  10. 苹果PD快充数据线的MFi认证查询方法