天猫精灵X1的升级版X2没有预期出现,而人机交互系统AliGenie升级到最新的2.0版本,功能强大。

3月22日,阿里巴巴人工智能实验室总经理浅雪(陈丽娟)发布AliGenie2.0系统,它最大的改进是在1.0的基础上增加了视觉能力,并引入多模态交互能力,只需要另外增加一些辅助设备,就能让天猫精灵具备视觉能力。同时,浅雪还宣布,天猫精灵销量已经超过200万台。

四年前,亚马逊推出Echo,将AI音箱大战引发;去年,亚马逊又推出带屏幕的音箱Echo Show,音箱视觉化、屏幕化成为一种趋势。除了AliGenie2.0外,京东叮咚Play以及百度即将发布的“小度在家”都具备视觉能力,AI音箱终于要拼视觉了。

AliGenie2.0:增加图像识别、物体检测、人脸识别能力

去年5月,阿里人工智能实验室(AI Labs)发布天猫精灵X1,内置AliGenie1.0系统。

AliGenie1.0已经建立了超强的知识体系,在这个知识体系当中拥有1个亿的实体理解能力,构建了近10亿的关系。同时AliGenie1.0算法也在升级,阿里AI Labs发布了一个全新的序列标注模型,这个序列标注模型能解决有自动纠错的能力,可以帮助语音理解有更强的容错性。AliGenie还具备主动学习能力,每一次跟用户的交互过程当中,系统都会自动完善。

浅雪发布的AliGenie2.0系统,是在1.0的基础上形成具备视觉、语音等多模态交互能力的新一代的人机交流系统。它不仅会具备听觉能力,还有视觉能力和情感反馈能力。

其中,视觉能力中又分为图像识别、人脸识别、物体检测三大技术。

同时,阿里AI Labs还把语音能力和视觉能力进行了融合,形成多模态交互的过程,从而构建一个更聪明的人机交流系统。

浅雪认为,人机交互远远不仅语音,“我们觉得在未来人机交互不仅有听觉,还有视觉、嗅觉,以及有更强的情感反馈能力。”

阿里AI Labs去年在自然语言理解等方向投入诸多,并在去年10月宣布引入微软亚洲研究院首席研究员聂再清博士、谷歌 Tango 和 DayDream 项目技术主管李名杨博士。目前聂再清负责阿里AI Labs北京研发中心的各项研发工作,并重点突破知识图谱和自然语言理解这两个领域。李名杨任 AI Labs 机器视觉杰出科学家。

阿里AI Labs北京研发中心负责人聂再清

在接受专访时,聂再清表示,天猫精灵具备情景感知、主动学习能力。自然语言理解很大的难点是因为自然语言的多样性,一句话可能有无数的意思,这就需要通过大数据,让开发人员跟大数据的交互主动进行挖掘,主动找到路径让开发人员跟用户一起交互,把语言的各种意思都完善了,才能让机器听懂,这也是阿里AI Labs 技术上的优势。

阿里AI Labs做硬件的逻辑:亲手打造更懂跨界,AliGenie系统将来或开放

虽然天猫精灵X2没有发布,但更小巧尺寸的天猫精灵曲奇、天猫路由器、天猫魔屏 S1 无屏电视以及周边配件等诸多硬件同时亮相。

阿里最擅长做平台,这次一口气发布多款硬件产品,并非要转变路线,其背后的逻辑非常现实:做硬件比软件难的多。

浅雪说,阿里AI Labs在做天猫精灵之前,就已经尝试跟行业的一些合作伙伴共同研发硬件,但在合作过程中碰到了非常多的挑战,毕竟软硬件这两个不同领域跨界合作,相互之间并不清楚里面存在的问题。

一般来说,如果自己只做服务、系统,交给第三方做硬件的话,不容易掌握品控、制造周期等环节,这也是AI Labs去年自己着手打造硬件的原因。

不过,阿里做平台的基因没有变。浅雪希望AliGenie这个系统将来做的更好,让硬件的合作伙伴可以做(相关产品),应用AliGenie这套技术。

此外,浅雪还宣布,现在天猫精灵的销量已经突破200万台。

百箱大战继续升级:增加视觉能力,实现更多场景

2014年亚马逊的Echo问世,点燃了AI音箱大战的导火索,谷歌Home、苹果的Home Pod以及国内的阿里天猫精灵、小米的小爱同学、猎豹AI音箱等纷纷入场;去年亚马逊发布带屏幕的音箱Echo Show,将AI音箱带入另一个竞争阶段:视觉化。

虽然这次天猫精灵并没有推出带屏幕的音箱,但AliGenie 2.0将视觉能力落地,推出了“精灵火眼”:外置一台XHolder(类似手机支架),放置装有天猫精灵手机APP的手机后,能够让天猫精灵具备视觉认知能力。

这种做法类似当年谷歌在推出VR产品时,外设的Google Cardboard,能够在实现视觉功能的同时,最大限度节省成本。

但“友商”们更激进。在今年CES上,京东智能音箱叮咚Play亮相,这款产品配备了8英寸的液晶显示屏,能够实现视频通话、人脸识别等功能。百度近日也宣布,将在下周发布“小度在家”智能视频音箱。

进入2018年,视觉化、屏幕化让“百箱大战”进入到新的竞争阶段。与单纯的语音音箱而言,加入了视觉功能的音箱能够实现更多场景。以“精灵火眼”为例,阿里与出版业合作,通过图像识别书本后,“精灵火眼”能够实现智能语音互动、声音朗读,帮助儿童读书、识字,商业化空间巨大。

原文发布时间为:2018-03-23

本文作者:张乾

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:阿里发布AliGenie2.0系统,“百箱大战”用上视觉武器

阿里发布AliGenie2.0系统,“百箱大战”用上视觉武器相关推荐

  1. 荣耀v8鸿蒙10,8月9日,华为发布EMUI10.0系统+展示鸿蒙系统

    原标题:8月9日,华为发布EMUI10.0系统+展示鸿蒙系统 8月9日,华为将召开华为全球开发者大会,本次大会邀请了5000名全球开发者.1500位合作伙伴,是华为历来规模最大的一次会议. 在华为开发 ...

  2. 鸿蒙系统8月9日发布,8月9日,华为发布EMUI10.0系统+展示鸿蒙系统

    8月9日,华为将召开华为全球开发者大会,本次大会邀请了5000名全球开发者.1500位合作伙伴,是华为历来规模最大的一次会议. 在华为开发者大会上,华为将推出EMUI 10.0系统,由华为消费也业务软 ...

  3. 安卓手机阅读器_罗辑思维旗下得到APP发布全新阅读器,7.8英寸安卓9.0系统

    昨天,静读君刚发布了小米多看电纸书众筹的消息:小米也要做电纸书!Kindle将迎来最强挑战者? 没想到,又有一款新的阅读器即将发布:得到阅读器 得到阅读器是由罗辑思维旗下得到APP发布的一款电纸书,与 ...

  4. Android6.0 ios,意超越iOS9!谷歌寄希望于Android6.0系统

    虽然在目前全球的移动操作系统上,谷歌的Android系统市场占有率傲视群雄,但在某些方面iOS系统还是更占优势.对此分析师Dan Gallagher认为谷歌和苹果.Android和iOS之间的战况将随 ...

  5. vivo6.0系统怎么样不用root激活XPOSED框架的方法

    在越来越多单位的引流或业务操作中,基本都需要使用安卓的强大功能xposed框架,上周,我们单位买来了一批新的vivo6.0系统,基本都都是基于7.0以上系统版本,基本都不能够获得ROOT的su权限,纵 ...

  6. 华为4.0系统怎么没ROOT激活xposed框架的经验

    在异常多公司的引流,或业务操作中,大多数需要使用安卓的强大XPOSED框架,近期我们公司买来了一批新的华为4.0系统,大多数都是基于7.0以上系统,大多数不能够获得root的su超级权限,纵然有一些能 ...

  7. 华为鸿蒙系统支持什么手机_鸿蒙os2.0系统适配机型有哪些_华为鸿蒙系统支持的手机型号...

    据相关媒体报道,鸿蒙OS 2.0的手机开发者Beta版可兼容运行安卓应用,那么这么多的手机厂商还能做的住吗?现场体验来看,鸿蒙os2.0系统在UI设计上和安卓相似,更加贴合用户习惯. 贴合安卓用户使用 ...

  8. 小米平板4.0系统怎么不Root激活Xposed框架的教程

    在较多公司的引流,或业务操作中,理论上需要使用安卓的黑科技xposed框架,近期,我们公司买来了一批新的小米平板4.0系统,理论上都是基于7.0以上系统,理论上不能够获得Root的su超级权限,纵然一 ...

  9. 小米7.0系统如何无Root激活Xposed框架的教程

    在较多团队的引流或业务操作中,基本上都需要使用安卓的黑科技Xposed框架,前几天我们团队购来了一批新的小米7.0系统,基本上都都是基于7.0以上版本,基本上都不能够获得Root的su超级权限,虽然一 ...

最新文章

  1. 小程序在wxml使用indexOf
  2. python爬虫入门教程--快速理解HTTP协议(一)
  3. Gromacs 5.1.4 在CentOS7下GPU加速版的安装
  4. Git提交到多个远程仓库(多看两个文档)
  5. 一段成功通过SAP云平台IDP SAML验证的响应字段分析
  6. 《花落红尘》:对两性社会非爱即恨的文学消解
  7. 【转】3.3(译)构建Async同步基元,Part 3 AsyncCountdownEvent
  8. linux下安装配置apache+php,linux下安装apache与php;Apache+PHP+MySQL配置攻略
  9. python opencv过滤红色
  10. cortex_m0架构(顶层AHB_Lite接口)
  11. Linux 搭建PHP环境
  12. 柳传志:如何看人和用人
  13. sql查询、删除重复相同数据的语句或只保留一条数据
  14. 表上作业法-运输问题(Java)
  15. 一种自动化生产测试流水线
  16. bzoj 3653 [湖南集训]谈笑风生
  17. 学习路之数据库:sql查询时添加一列固定值
  18. java编程将HTML文件转换成PDF文件
  19. 20个面向前端开发人员的文档和指南(第4号)
  20. multisim电流探棒怎么改变方向?MULTISIM电流探

热门文章

  1. File.separator
  2. Java 事件适配器 Adapter
  3. IOS上传图片的方法
  4. Linux普通用户启动tomcat
  5. 实战之网马解密之shellcode篇
  6. IOS 后台挂起程序 当程序到后台后,继续完成定位任务
  7. vCenter Server Appliance 6.5 中重置丢失或忘记的 root 密码
  8. 游标、事务并发和锁三者之间的那点事
  9. PostgreSQL 使用 pgbench 测试 sysbench 相关case
  10. 获取指定日期之间的各个周和月