摘要:结合一个仿制的简易Flappy Bird游戏,ModelBox体感小游戏就这样诞生了。

本文分享自华为云社区《ModelBox开发案例 - 体感小游戏》,作者:菊厂飞戈。

前段时间,小鱼老师在AI说发布了文章 ModelBox推理真的高效吗,里面介绍了双阶段单人人体关键点检测案例,运行速度超快:使用原生的ONNXRuntime API做开发,可以达到36fps;而ModelBox版本(推理框架同样是ONNXRuntime),更是达到了接近80fps!

于是乎,笔者产生了一个大胆的想法:这么快的人体关键点检测应用,不用来跑游戏可惜了呀!经过一段时间的开发调试,结合一个仿制的简易Flappy Bird游戏,ModelBox体感小游戏诞生了:

玩家通过上下摆动双臂做出“扇动翅膀”的动作,阻止小鸟下落,躲避画面中的“狼柱”;如果小鸟不小心碰到了“狼”或者触碰到画面边缘,游戏停止,然后会重新开始。画面左上方显示的是玩家存活的时长。

本案例使用的是Windows版本的 ModelBox SDK,如果对此还不熟悉,请先阅读 ModelBox端云协同AI开发套件(Windows)开发环境篇,如果对 ModelBox AI应用开发感兴趣,欢迎参加我们的 ModelBox实战营。

工程结构

本案例是在小鱼老师的 single_human_pose 应用基础上修改而来,案例所需资源(代码、模型、测试数据等)均可从obs桶下载。工程目录与原始版本基本一致,下面列出其中不一样的地方:

single_human_pose├─data│  ├─game                           // 体感游戏资源目录│      ├─icon                       // 体感游戏所需的图标资源│      ├─src // 体感游戏源代码,可独立运行│  └─dance_120fps.mp4               // 测试视频├─etc│  └─flowunit // 功能单元目录│      ├─draw_pose // 关键点绘制功能单元│         ├─draw_pose.py            // 关键点绘制功能单元入口文件│         ├─draw_pose.toml // 关键点绘制功能单元配置文件│         ├─draw_utils.py           // 其他功能函数存放文件│         ├─flappy.py               // Flappy Bird核心逻辑│         ├─smooth.py               // 平滑算法,使关键点更稳定│         └─vector.py               // 平面坐标系中点的运算│      ├─... // 其他功能单元├─graph│  ├─single_human_pose.toml // 默认的技能流程图│  └─single_human_pose_camera.toml // 使用摄像头运行的技能流程图├─...└─build_project.sh

Flappy Bird

本案例中游戏相关的资源和代码在 data/game 目录下,我们可以直接执行其中 src 下的 main.py 文件,得到一个使用键盘控制的 Flappy Bird 游戏。main.py 文件中的核心函数内容如下:

def run():# 初始化游戏snake = Snake()    # 贪吃蛇flappy = Flappy()  # Flappy Birdpacman = Pacman()  # 吃豆人# 初始化摄像头,参数0表示设备的第一个摄像头cap = cv2.VideoCapture(0)# 判断摄像头初始化是否成功if not cap.isOpened():print('failed to open camera 0')exit()# 设置分辨率为 960 x 540cap.set(3, 960)cap.set(4, 540)while True:# 读取一帧视频图像,ret表示读取是否成功ret, frame = cap.read()# 对原始图像做高斯模糊,避免干扰到游戏画面frame = cv2.GaussianBlur(frame, (0, 0), 5)# 阻塞等待键盘响应1ms,获取按下的按键值pressed_key = cv2.waitKey(1) & 0xFFif pressed_key == ord('q'): # 如果按下q键则退出游戏breakelse: # 根据按键类型更新游戏画面# frame = snake.update_snake_keyboard(frame, pressed_key)frame = flappy.update_flappy_keyboard(frame, pressed_key)# frame = pacman.update_pacman_keyboard(frame, pressed_key)# 打开一个名为game的窗口,显示图像cv2.imshow('game', frame)# 释放摄像头资源cap.release()# 关闭所有窗口cv2.destroyAllWindows()

可以看到,其中包含了3个小游戏:贪吃蛇、吃豆人和Flappy Bird。游戏界面使用OpenCV绘制,程序将打开0号摄像头,将游戏画面叠加在摄像头画面上;在每帧的绘制中,程序阻塞1ms等待键盘响应,根据按键不同控制游戏的运行:按下空格键将控制小鸟往上飞行一段距离(具体内容查看 src/flappy.py )。开发者可以解开另外两个游戏的注释代码,试试它们的游戏效果。

关键点绘制功能单元

Flappy Bird游戏与人体关键点检测应用的结合,完全容纳在 draw_pose 功能单元中。在原始的 single_human_pose 应用里,这个功能单元只是将检测到的关键点数据绘制到画面中;本应用中,在得到人体关键点数据后,又计算了双臂与身体的夹角,如果检测到“扇动翅膀”的动作,则控制小鸟往上飞行一段距离。游戏画面与高斯模糊后的人体关键点画面叠加在一起显示,既能看到AI应用的效果,也不至于干扰到游戏画面的显示。

    def open(self, config):...# 使用图标资源初始化Flappy Bird游戏控制示例icon_path = config.get_string("icon_path", ".")self.flappy = Flappy(icon_path)return modelbox.Status.StatusCode.STATUS_SUCCESSdef process(self, data_context):...for image, hand_pose in zip(in_image, in_feat):...# 获取上一功能单元输出的人体关键点数据pose_data = np.array(hand_pose.as_object(), copy=False)pose_data = pose_data.reshape((self.kps, 3))# 计算双臂与身体的夹角arm_angles = get_arm_angles(bbox, pose_data, self.keypoints_smooth)...# 在摄像头画面中画出主要的人体关节,并作高斯模糊draw_pose(out_img, bbox, pose_data, self.score_thre)out_img = cv2.GaussianBlur(out_img, (0, 0), 5)# 根据双臂动作控制游戏画面更新,叠加到摄像头画面中做展示out_img, alive = self.flappy.update_flappy_pose(out_img, arm_angles, fps)...return modelbox.Status.StatusCode.STATUS_SUCCESS

camera流程图

游戏的运行需要实时的摄像头画面,因此本案例增加了使用PC自带或者外接的USB摄像头作为输入源的流程图,对应文件为 single_human_pose_camera.toml,其中的流程图描述 graphconf 内容如下:

graphconf = """digraph single_human_pose {node [shape=Mrecord]queue_size = 1batch_size = 1input1[type=input,flowunit=input,device=cpu,deviceid=0]data_source_parser[type=flowunit, flowunit=data_source_parser, device=cpu, deviceid=0]local_camera[type=flowunit, flowunit=local_camera, device=cpu, deviceid=0, pix_fmt=bgr, cam_width=960, cam_height=540]det_pre[type=flowunit, flowunit=det_pre, device=cpu, deviceid=0]color_transpose[type=flowunit flowunit=packed_planar_transpose device=cpu deviceid=0]normalize[type=flowunit flowunit=normalize device=cpu deviceid=0 standard_deviation_inverse="0.003921568627451, 0.003921568627451, 0.003921568627451"]det_human[type=flowunit, flowunit=det_human, device=cpu, deviceid=0, batch_size=1]det_post[type=flowunit, flowunit=det_post, device=cpu, deviceid=0]object_tracker[type=flowunit, flowunit=object_tracker, device=cpu, deviceid=0]expand_box[type=flowunit, flowunit=expand_box, device=cpu, deviceid=0]image_resize[type=flowunit flowunit=resize device=cpu deviceid="0" image_width=192, image_height=256]color_transpose2[type=flowunit flowunit=packed_planar_transpose device=cpu deviceid=0]mean[type=flowunit flowunit=mean device=cpu deviceid="0" mean="116.28,103.53,123.68"]normalize2[type=flowunit flowunit=normalize device=cpu deviceid="0" standard_deviation_inverse="0.0175070,0.01742919,0.01712475"]det_pose[type=flowunit, flowunit=det_pose, device=cpu, deviceid=0, batch_size=1]pose_post[type=flowunit, flowunit=pose_post, device=cpu, deviceid=0]draw_pose[type=flowunit, flowunit=draw_pose, device=cpu, deviceid=0]video_out[type=flowunit, flowunit=video_out, device=cpu, deviceid=0]input1 -> data_source_parser:in_datadata_source_parser:out_video_url -> local_camera:in_camera_packetlocal_camera:out_camera_frame -> det_pre:in_imagedet_pre:resized_image -> color_transpose:in_imagecolor_transpose:out_image -> normalize:in_datanormalize:out_data -> det_human:inputdet_human:output1 -> det_post:in_feat1det_human:output2 -> det_post:in_feat2det_human:output3 -> det_post:in_feat3det_pre:out_image -> det_post:in_imagedet_post:has_human -> object_tracker:in_imageobject_tracker:out_image -> expand_box:in_imageexpand_box:out_image -> image_resize:in_imageimage_resize:out_image -> color_transpose2:in_imagecolor_transpose2:out_image -> mean:in_datamean:out_data -> normalize2:in_datanormalize2:out_data -> det_pose:imagedet_pose:heatmap -> pose_post:in_featpose_post:out_data -> draw_pose:in_featobject_tracker:out_image -> draw_pose:in_imagedraw_pose:out_image -> video_out:in_video_framedet_post:no_human -> video_out:in_video_frame
}"""

与 single_human_pose.toml 相比,这个流程图使用 local_camera 替换了 video_demuxer 和 video_decoder 功能单元,其他部分是一致的。

打开工程目录下bin/mock_task.toml文件,修改其中的任务输入和任务输出配置为如下内容:

[input]
type = "url"
url = "0"  # 表示0号摄像头,即PC自带摄像头,若PC无摄像头需外接USB摄像头
[output]
type = "local"
url = "0:pose_game"  # 表示名为```pose_game```的本地窗口

即使用编号为0的摄像头(默认为PC自带的摄像头),输出画面显示到名为pose_game的本地屏幕窗口中。

执行bin/main.bat camera运行应用,就可以开始游戏了:

改造自己的体感小游戏

本案例展示了 ModelBox AI应用与游戏的结合,开发者可以调整其中的游戏逻辑控制游戏的难易程度,如小鸟降落/飞升的速度、狼柱的出现频率与位置等;还可以改成使用其他动作或者手势控制小鸟飞行,如僵尸跳、开合跳等;另外,案例中提供了贪吃蛇、吃豆人这两款游戏源码,开发者也可以将它们改造成体感小游戏。

行动起来,去享受AI与游戏的乐趣吧~~

11月3号晚19点,将进行AI养猪 实时看护猪的健康直播,华为云AI发烧友在线带你学习ModelBox框架,快速AI应用,实现AI监测猪的健康状态。

参与直播互动,有机会赢取华为自拍杆、雷柏机械键盘、ModelArts书籍等多重好礼,还等什么,马上报名吧!

报名链接:AI养猪 实时看护猪的健康_开发者-华为云

点击关注,第一时间了解华为云新鲜技术~

程序员买啥游戏机,自己动手做一个体感小游戏相关推荐

  1. 程序员被空姐骗到香港做传销!(当事人讲述完整详细版)

    黑客技术 点击右侧关注,了解黑客的世界! Java开发进阶 点击右侧关注,掌握进阶之路! Python开发 点击右侧关注,探讨技术话题! 作者丨纯洁的微笑 来源丨纯洁的微笑(keeppuresmile ...

  2. 为什么程序员都很排斥面试时做题?答不出题的程序员会是大牛吗?

    相信很多人都有过这样的经历,就是去面试的时候,先被要求做题. 如果像下面的判断选择还好! 如果是让写个什么算法之类的,那就呵呵了!每天和鼠标握手,还哪会写字啊! 关于这件事,很多小伙伴纷纷吐槽. 网友 ...

  3. 程序员在创业项目中能做些什么

    摘要 程序员在创业项目中能做什么,这个问题问的有些奇怪,程序员除了写代码还能干什么呢,管你做什么业务,电商,O2O,金融,SAAS,都是一把梭,没有什么CRUD解决不了的·.本文谈谈我的不同看法 价值 ...

  4. 程序员如何判断自己能不能做管理

    有很多程序员,干了几年之后,看到别人做领导,做管理,特别眼红,眼气,羡慕嫉妒恨,五味杂陈. 其实呢,干什么有什么的难处,别的人干得了的,你未必干的了. 下文我剖析一下,程序员如何判断自己能不能做管理. ...

  5. 抖音程序员表白代码c语言,程序员过情人节:教你做抖音同款表白程序!

    原标题:程序员过情人节:教你做抖音同款表白程序! 最近抖音上一个很简单的vbs告白编程代码视频火了,双击这个编程代码编写的软件后会弹出一个窗口显示一段话,点击确定后会显示下一句.这个小程序很有意思也很 ...

  6. 程序员:多用吐槽的时间做点实际的事情

    不好意思,如果图片不能查看,请访问 下面地方查看,谢谢! 程序员:多用吐槽的时间做点实际的事情 昨天晚上很晚才睡觉,夜深的时候,静下心来,想想这一天,也想想这一年. 也就在昨晚加入一个知识星球,&qu ...

  7. 做程序员工资很高,但做程序员真的是吃青春饭的吗?

    在进入互联网行业发展之前,我就已经听到过很多人说互联网行业程序员的工资很高,但同时程序也是吃青春饭的.当程序员的年龄过了30~35岁以后,如果他们还没有转型,如果他们还在一线编码,那他们就很难再继续混 ...

  8. Esp8266学习之旅13 动手做个8266毕设小案例,smartConfig + MQTT协议轻松实现远程控制一盏LED。(附带demo)

    本系列博客学习由非官方人员 半颗心脏 潜心所力所写,不做开发板.仅仅做个人技术交流分享,不做任何商业用途.如有不对之处,请留言,本人及时更改. 序号 SDK版本 内容 链接 1 nonos2.0 搭建 ...

  9. 阿里程序员发70多万年终奖表示略感失望,网友:不要的话请给我!

    阿里程序员发70多万年终奖表示略感失望,网友:不要的话请给我! 新生前端 03-24 18:25 关注 阿里开始发年终奖了,不少阿里员工开始在网络论坛上相互打探消息,看看自己拿的是多还是少.因为阿里的 ...

最新文章

  1. 为什么123 and 456结果是456而123 or 456结果是123?
  2. 3、假设有一个对象数组,想根据某个对象属性对数组进行排序时
  3. svn 413 Request Entity Too Large 错误的解决方法
  4. 在PHP中实现中文汉字验证码
  5. object detection错误之Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
  6. iOS:对GCD中 同步、异步、并行、串行的见解
  7. 《战术篇》阵型的设定与编辑,战术命令详解
  8. 克拉默法则(Cramer's Rule)的证明
  9. 粒子群优化算法PSO
  10. C/C++基于MFC的网速监控,一招教你实时监控网速!
  11. iOS项目开发中的知识点与问题收集整理
  12. 达威尔CHERRY樱桃轴 铝合金有线背光电竞吃鸡游戏机械键盘
  13. 数据结构习题集作业代码(第一章)
  14. 梁宇轩 mysql 语句学习一 对表的操作
  15. 妈蛋!!!3年的资料一时手格式化了!!!
  16. 《Python核心技术第二版》笔记
  17. 示波器的基本原理之一:带宽
  18. 线程相关内存参数sort_buffer/join_buffer等的内存分配时机
  19. 专访豌豆荚:团队如何高效率工作?
  20. leetcode1542. 找出最长的超赞子字符串

热门文章

  1. 专转本-数学考试大纲
  2. 使用zabbix_sender发送文本
  3. 【转】类别catagory的用法
  4. 关于UI设计学习,推荐6个高质量的学习网站!
  5. 【bzoj1050】 旅行comf
  6. 【考研英语】作文套话(自用)
  7. linux dup作用,unix/linux中的dup()系统调用
  8. Linux命令退格键变成^H的解决办法
  9. 使用预训练模型训练YOLOv3-Keras
  10. WIN10系统ThinkPad S5 3D摄像头终极解决方案(实感深度摄像头)