允中 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

关于vivo,如果你还完全停留在“做手机”层面,是时候刷新印象了。

刚刚,他们披露了AI研究方面的最新进展,和此前的潮头公司一样,vivo也把目光投向游戏领域,而且一出手就是《王者荣耀》。

究竟是怎样一回事?

AI打游戏

事情可以从上周五那场“星际2”人机大战说起。

当时DeepMind开发的全新AI程序AlphaStar,以10:1战绩,“完虐”人类职业高手。

激战之后,更多AI打游戏的意义被广泛科普。

一方面是挑战性。例如动作的种类,围棋只有361个下棋位置,星际2算上各种技能和走位控制,即便一个84x84分辨率的小屏幕,也有一亿多种可能的操作。

同时,在玩“星际2”的过程中,玩家并不能看到整个战场的信息,你甚至还要猜测、估算对方的行动,来进行你自己的规划和决策。

另一方面是意义。因为人类一直对AI不能完全掌握,再加上AI技术和应用探索的过程中往往需要大量的数据,可以随意试错、拥有大量人类数据的电子游戏,一直被视为人工智能最好的实验平台之一。

因为游戏本身就是人为创造的,用以帮助人来习得某个技能或者作为测试技能水平的工具。

而后者,也正是vivo拿《王者荣耀》进行AI尝试的核心原因。

训练AI打《王者荣耀》

2018年初,vivo在战略发布会上宣布将建立vivo AI Lab,其后7月,该实验室正式成立,并紧接着对《王者荣耀》发起了AI冲击。

本次vivo AI Lab所使用的强化学习架构

而且本次vivo AI Lab还专门提出并使用了一种全新的分层强化学习模型。

这种神经网络模型,既能够通过模仿人类来制定宏观策略,同时还能根据强化学习来保证微观操作。

尤其适应即时战略游戏(RTS)对于操作的需求。

就《王者荣耀》而言,关键性的大局观包括:“去哪儿”、“应该何时去支援队友”、“队友应该何时一起参加团战”……

而重要的精细化操作则包括:“何时闪现”、“何时交出大招”、“多人团战中应该如何精细走位”、“团战中应该如何释放技能”。

上述两种操作,对人类玩家稀疏平常,对AI却别有挑战。

而且也需要具体问题具体分析,需要有不同的应对策略。

此次vivo AI Lab,就分别采用了不同的策略。

针对大局观,因为很难量化和计算,需要先参考人类数据,进行模仿学习和专家引导。

而在精细化操作时,vivo AI Lab直接使用了“多智能体”强化学习方法。

通俗来说,可以视为成百上千个机器人在虚拟团战走位、技能释放等操作,其中只有表现最好的能够留下来。通过不断的对垒,让机器自然而然学会最优操作方式。

如图中情况,训练过程中,一旦观察到电脑开大,马上闪现然后反身开大,整个过程一气呵成。

当然,最终结果也给出了最直接反馈。

经过一系列神经网络训练后,vivo AI Lab的模型在1 V 1模式下能以100%胜率击败游戏中的内置AI。

另外,也能在5 V 5模式下,以AI战队的形式表现出较好的协同性能。

不止于让AI“打”游戏

为胜而出发,自然也不是vivo教AI打《王者荣耀》的全部。

在实验全新深度学习模型的同时,vivo AI Lab也在尝试另一条更具挑战的路——不使用游戏的API接口,转而直接从图像监测并获取游戏中的各种特征数据。

之前,很多公司和机构都曾在电子游戏上发起人工智能挑战,但基本都采用了游戏的API接口,可以让AI无需经过图像分析等手段就能直接获知游戏中各个单位、环境的数据。

AlphaStar获取的游戏数据:非常简洁

比如DeepMind的AlphaStar,它并没有直接从图像中获取单位信息,而是从游戏引擎里面读取特征数据,这些图像直接标记了哪里是兵、哪里是工厂。

但vivo则选择了更难的路。

vivo AI Lab专门搭建了一套深度学习模型来捕捉《王者荣耀》中5个英雄的特征。

更直白说,就是把5个英雄对应的大地图和小地图数据,通过卷积神经网络提取信息,结合多目标检测提取的特征向量,再输入到上文所提到的分层神经网络当中。然后各个英雄根据自身状态环境,决策出不同的动作,实现在各自情况下的对应操作。

为什么要这么做?

vivo AI Lab解释说,虽然这个过程不起眼,但实际上却可能对AI的表现有很大影响。

毕竟实际用户都是通过手机显示的图像来获取信息,假如人工智能都从API接口来获取信息,又怎么能保证这些信息的层级和精准度都是跟人类从图像中获取的一致?

所以vivo所想,正是宁愿额外花力气填补流程,希望让AI能够完整模拟人类从看到屏幕上图像,到实际操作的全过程——让AI的运转环境条件更接近普通用户。

分布式神经网络训练环境

值得一提的是,为了实现同时对多个英雄数据采集,并且提高整个《王者荣耀》人工智能模型的采样效率、样本多样性和训练速度。

vivo AI Lab还搭建了一整个分布式强化学习环境:终端、PC端和云端一体运用。

其中,手机负责游戏的运行、动作执行和数据采集;

电脑负责连接手机和服务器,进行强化学习算法选择、动作决策单元的运转;

云端的GPU服务器集群负责整个神经网络的运行和存储。

并且在该环节,vivo AI Lab还直接使用了全开源的gRPC技术,这是HTTP 2.0时代的基础底层数据框架。

也能让整个“分布式强化学习环境”具有极大的网络化潜力。

面向AI时代打造手机

当然,至此,可能你也能窥见vivo训练AI打游戏的雄心所在了。

跟单纯通过游戏训练AI并“迁移”到其他场景不同,vivo既然不使用游戏的API接口、转而从游戏界面的图像获取数据,那更在意的显然是未来性

怎么理解这种未来性?

vivo方面说,因为整个深度学习过程中的数据都是从手机终端直接采样而得,除了其他玩法类似、基础操作需求相近、图像识别相近的游戏外,vivo还能利用与本次尝试相同的架构(手机图像识别+特定深度学习神经网络+深度学习网络化环境),对手机中的各种场景进行学习归纳。

最终让vivo手机从方方面更懂你。

此外,这次采用gRPC技术来构建整个人工智能学习环境的数据传输,也能以网络化方式解决“如何采集到足够的样本数据”和“如何让尽可能多的用户用上花大力气训练出来的神经网络”等业内难题。

所以vivo此次尝试,实际也是一次面向AI时代打造智能手机的试水。

而且对于vivo来说,AI也已经在手机体验中发挥作用。

2018年3月,vivo在X21上首次发布了“Jovi”人工智能助手,能够在屏幕中直接识别人物、快递、景点地址、网址等关键信息。

负一屏的“智慧场景” ,则能有效地将通勤时间、票务酒店预订、步数、天气等信息进行整合展示。

其后9月,vivo还发布了全新的IoT战略——Jovi物联,希望让Jovi能够适配一系列智能家居产品,让Jovi成为“把人和数字世界联系在一起”的控制核心。

如今,披露的《王者荣耀》AI,亦是对这份壮志雄心的进一步推动。

现在,是时候刷新对vivo的印象了。

传送门

最后,本次vivo的《王者荣耀》AI,vivo AI Lab也形成了公开论文,点击“阅读原文”即可前往。

2018中国人工智能最受尊敬投资机构

加入社群

为给AI从业者提供更好的交流平台,量子位现开放「AI+教育」行业社群,欢迎小伙伴入群交流。

面向人群:AI+教育相关从业者,技术、产品等人员;

入群方式:请添加小助手7,微信号:qbitbot7,并发送‘教育群+您的姓名+公司+职位+工作内容简介’。

Ps.为保证社群价值,小助手会对申请入群的朋友进行审核,请大家理解!

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

你已经是台成熟的vivo手机了,要自己学会打王者相关推荐

  1. 进阶高端,2017年vivo手机用实力说话

    从3月到11月,vivo在2016年一共发布了8款产品.正是凭借这8款产品在市场上的出色表现,vivo在2016获得了较2015年出货量增幅100%的骄人战绩,总出货量达8000万台.成为国产手机的绝 ...

  2. vivo手机怎么投屏到电脑_小功能大用处!vivo手机的智慧投屏,轻松实现“跨屏显示”...

    随着网络科技的发展,手机在生活中起着越来越重要的作用,不仅能够看视频玩游戏,甚至还能实现轻办公.由于目前处于特殊时期,不少企业和学校不得不延长假期,纷纷开展远程办公.远程学习的模式.虽然手机能完成很多 ...

  3. vivo手机计算机记录怎么找回,如何从Vivo手机恢复已删除的照片,您将在阅读后知道...

    vivo手机是我们最喜欢的手机之一. 我喜欢用vivo手机拍照. 排除效果特别好. 有时我不小心删除了我拍摄的令人满意的照片,这使我很烦. 不久前vivo手机的挂件删除后怎么恢复,我发现了一种可以还原 ...

  4. Vivo手机获取文件管理器里的文件路径为空

    近日测试反馈了一个奇怪的bug,说是在一台vivo手机上无法获取文件,一开始还以为是这台手机的第三方文件管理器的原因,后来发现不是.直到打印出这次获得的url才发现了问题的所在,这个url是一个很奇怪 ...

  5. vivo手机计算机恢复出厂设置,vivo手机系统恢复出厂设置里面清除所有数据

    "哎呀,手机怎么又卡了!完了这局农药又要输了..." "这个破手机,才用了一年就卡的不要不要的了." "是时候要通过恢复出厂设置来解决了~!" ...

  6. vivo手机哪款支持鸿蒙系统,vivo手机可以安装华为鸿蒙系统吗?

    华为在6月2日发布了一个新的Harmonyos 2系统2.目前,华为最新的手机可以支持红发系统,然后使用体内用户要求vivo升级红发系统? vivo什么时候上网?红发制度,目前支持升级的第三方手机是什 ...

  7. vivo手机连接到电脑

    首先说明一下我自己的情况 我有一部vivo手机,x23 然后我有一台win7笔记本电脑 通过一个华为路由建立的wifi上网 那天我想让手机投屏到笔记本电脑上 但是遇到各种问题 1)百度的失败 首先就是 ...

  8. vivo手机安装应用自动输入密码

    公司买了台vivo的x21 UDA的测试机,在使用Android Studio安装到手机的时候每次都必须输入密码,还没办法关闭,vivo手机不能root 不能刷机,实在太恶心了.所以想到用Access ...

  9. 为赢取市场,vivo手机性价比超过小米,性价比旗手易位

    今天vivo发布了新款性价比手机iQOO7,其余小米11一样采用了骁龙888芯片,其他配置方面也基本相当,但是iQOO7的价格要比小米11低200元,这似乎显示出双方正争夺性价比旗手位置. 一直以来性 ...

最新文章

  1. 黑客必知的SQL语句 黑客知道,程序员必知
  2. 开放平台鉴权以及OAuth2.0介绍
  3. EMC Isilon(OneFS)删除重要数据后恢复案例
  4. Oracle 11g安装步骤详谈
  5. linux pmap命令,Linux pmap 命令用法详解-Linux命令大全(手册)
  6. ABAP/4 Open SQL
  7. 单板机 单片机 c语言,单板机 单片机 个人计算机有什么区别吗
  8. 空无达摩院——机器智能技术的发展
  9. golang调用matlab,Golang中Proto编写和生成
  10. 40 MM配置-采购-采购订单-STO配置-定义凭证类型和可用性检查设置
  11. sonarqube怎么分析php项目,SonarQube代码质量分析平台介绍
  12. 死磕 18 个 Java 8 的日期处理,工作必用!
  13. servlet3多文件上传_Servlet 3文件上传– @MultipartConfig,部分
  14. docker api java_docker-java Docker的java API
  15. Linux-socket使用
  16. jupyter nootbook支持matlab语言
  17. 计算机发送到桌面快捷方式,win10电脑没有发送到桌面快捷方式选项的详细恢复步骤...
  18. php李炎恢笔记,一步步学习php笔记 李炎恢瓢城web俱乐部
  19. C++ 虚函数实现:虚函数表 虚表指针
  20. 在华为手机上查看连接过的wifi密码(不愁记性不好)

热门文章

  1. 为什么物联网产品迫切需要良好的 UI/UX 设计?
  2. 快看,我们的分布式缓存就是这样把注册中心搞崩塌的!
  3. 2018 终了,是时候秀出我的 Git 进化日志了!
  4. 麦肯锡用 160 页报告告诉我们:13 年后 8 亿人的饭碗会被机器人抢了
  5. mysql odb驱动_odb C++访问mysql数据库,从安装到写入
  6. 怎样取消苹果手机x的静音设置_安卓不仿苹果静音键?千万别小瞧“静音键”, 功能竟如此强悍!...
  7. 火爆全网MySQL路线笔记!java文件读取中文乱码
  8. 金三银四大厂面经总结,mysql创建视图的sql语句
  9. 阿克苏计算机考试成绩查询,阿克苏高考成绩查询系统2021
  10. mysql管理索引_Mysql管理表和索引