安妮 发自 751D·Park
量子位 出品 | 公众号 QbitAI

昨天,在阿里巴巴2018年春季发布会上,阿里AI实验室推出了第二代中文人机交流系统AliGenie 2.0,在“听”和“说”的基础上引入了视觉能力,搭载AliGenie 2.0的“精灵火眼”功能也同时亮相。

此外,天猫路由、天猫魔屏S1和天猫精灵曲奇三款新品也一同面市。

 阿里AI实验室负责人浅雪在发布会现场

AliGenie 2.0

距离去年7月发布搭载了AliGenie的天猫精灵X1已八个月有余,销量怎么样了?阿里AI实验室负责人浅雪表示已经卖出了200万台。

和以往不太一样的是,此次推出的AliGenie2.0具备了视觉的能力,能够进行视觉认知、多模态交互、情景感知。

AliGenie 2.0首先将视觉能力落地在天猫精灵X1上,通过具有天猫精灵手机APP实现“精灵火眼”功能。

此外,阿里AI实验室还推出了一个可以戴在天猫精灵X1头上的“帽子”XHolder,以便将手机放在XHolder支架上捕捉图像,同时手机还会显示出一对大眼睛。

 天猫精灵X1+XHolder+App精灵火眼

对了,XHolder目前售价为49.9元。

 XHolder外观

核心功能

精灵火眼的核心能力有两个:“视觉认知”和“表情系统”。

表情系统是指基于3D虚拟形象,提供自然交互的表情拟态动画,目前包括近20多种拟态动画。通过App的屏幕触摸它的鼻子眼睛或额头,能得到不同的反馈,还能看到它生气或撒娇的样子。

视觉认知主要面向儿童,精灵火眼通过图像识别,结合智能语音互动、声音朗读,帮助儿童读书、识字。

目前,阿里AI实验室已经联合中国少年儿童出版社、安徽少儿出版社等国内顶尖的出版社,选择了适合3岁到8岁儿童的117套图书,儿童只需将绘本展示给天猫精灵,即可听到有声版的故事。

 庄周梦蝶故事画面

此外,老年人也是精灵火眼的一大受众。阿里AI实验室开发了识别药盒的功能,与阿里健康合作,能够识别4万种药盒。只要用精灵火眼扫一扫药盒,就能用语音播报药名、功效、过期日等信息。

未来,阿里AI实验室还将计划引入万物识别、人脸识别等功能。“我们今天推出的精灵火眼功能,也只是视觉功能的开始。”阿里人工智能实验室产品总监释空在接受采访时说。

这里还有一个插曲。

在现场演示精灵火眼功能时,天猫精灵还一度没有声音,只有两只大眼睛做着各种各样的表情。在程序员“祭天”回来的二度展示时,声音才恢复正常。

新品三连发

除了精灵火眼外,此次发布会还推出了阿里AI实验室的三款新品。

天猫路由售价199元,是一个“没有触角”的路由,天线为隐形设计,不同Wifi热点之间无缝切换。

天猫魔屏S1是一个可以联合天猫精灵联合使用的投影仪,最大投射屏幕300吋,售价4699元,以后在家里就能享受巨幕效果了。

天猫精灵曲奇是个Q版的智能音箱,身高只有天猫精灵X1的一半,目前预售价为299元。

可以发现,这三款新设备,刚好是人机交互的“输入设备”,“链接设备”以及人机交互的“输出设备”。阿里方表示,输入/连接/输出的智能化这是AI实验室对智联网的三个关键组成部分的理解。

“我们生活在一个工业时代跨度到数字时代的过程,我们今天可能没有办法改变一个药盒的外观,但是我们可以改变一个药盒的浏览方式,这就是人工智能实验室想为我们这个世界带来的一点点爱。”浅雪说。

作者系网易新闻·网易号“各有态度”签约作者

加入社群

量子位AI社群15群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot6入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot6,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。


量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


阿里AI智能音箱现在有了视觉能力,跟人交互时表情丰富相关推荐

  1. AI智能音箱五大功能中应用的数字功放芯片

    AI智能音箱多基于语音控制,其基本交互流程可以用下图概括:1)用户通过自然语言向音箱提出服务请求或问题 2)音箱拾取用户声音(音箱本地完成)并分析(一般在服务器端完成)3)音箱通过语言播报(音箱端)和 ...

  2. AI智能音箱技术方案开发

    随着智能科技的不断发展,我们身边的产品随时都能被攻城狮们赋予智慧.比如我们传统的家居音箱,以前它只能连接电脑或者手机蓝牙来当成外置扬声器播放,而现在它被程序猿赋予了更加人性化的的操作和功能,可以与无线 ...

  3. 天猫精灵方糖AI智能音箱拆解报告

    天猫精灵方糖AI智能音箱拆解报告 前言 拆解 总结 前言 天猫精灵方糖AI智能音箱可以设闹钟.讲故事.听音乐.语音控制智能家电.购物等多种功能.机身尺寸134 mm×65 mm×59mm,重265g. ...

  4. 国内热门AI智能音箱品牌都采用了哪些功放芯片

    音频功放IC是各类音响.耳机等器材不可或缺的一部分:音频功率放大器芯片俗称"扩音器",是音响系统中最基本的设备,负责将来自信号源的微弱电信号进行放大,以驱动扬声器发声,从而将声音传 ...

  5. AI智能音箱高性价比出好音质的功放芯片

    近几年人工智能等技术的不断发展,AI智能音箱已成为炙手可热的爆款:众多企业纷纷加入其中:如我们熟知的天猫精灵.小爱同学.小度智能音箱.华为AI音箱.腾讯叮当等等智能音箱:据不完全统计,目前国内做智能音 ...

  6. AI智能音箱工作原理中应用的数字功放芯片

    AI智能音箱是一个音箱升级的产物,是家庭消费者用语音进行上网的一个工具,比如点播歌曲.上网购物,或是了解天气预报,它也可以对智能家居设备进行控制,比如打开窗帘.设置冰箱温度.提前让热水器升温等. 智能 ...

  7. 小米AI智能音箱使用了哪些技术

    小米的AI智能音箱,是小米公司在2017年7月26日发布的一款智能音箱,主要是由小米电视.小米大脑.小米探索实验室联合开发,AI音箱的唤醒词是"小爱同学". 作为一名成功的创业人雷 ...

  8. 人机对话的梦想与AI智能音箱

    自从计算机诞生以来,人类就有一个梦想,那就是实现人机对话,不但让让机器.计算机或者机器人听懂人类的语言或命令,而且可以让人类和机器.计算机或者机器人进行对话聊天.今天,随着带人工智能语音识别能力的技术 ...

  9. 强化学习、GAN与多巴胺对撞:阿里AI 智能体认知研讨会干货

    2017年4月,阿里巴巴首次向外公布在人工智能"认知"层面上的研究成果:阿里巴巴认知计算实验室与伦敦大学学院计算机系合作,以游戏"星际争霸1"中的微观战斗场景为 ...

最新文章

  1. Oracle别名大小写 -----解决方案
  2. 微信url schema,deep link
  3. (问题)c语言现代方法2th,自己编写的reminder.c程序 找错/修改/拓展延伸
  4. pdfplumber解析pdf文件
  5. tomcat性能调优和性能监控(visualvm)
  6. 记一次微信H5全屏播放视频的总结
  7. ucore 地址映射的几个阶段
  8. pmp华为内部资料,成功的项目管理是怎样的?
  9. JPA mappedBy、JoinColumn、FetchType.LAZY和FetchType.EAGER介绍
  10. coon.php连接,PHP 连接 MySQL
  11. Access-Control-Allow-Origin跨域问题,使用Nginx配置来解决
  12. python代码变成so
  13. JavaScript的执行机制——作用域链和闭包
  14. OpenCV基础知识
  15. 砍价两种种算法(转载)
  16. 局域网、广域网、Internet
  17. layui表格自定义分页
  18. python中变量,Python中的变量、数据类型、运算符
  19. vue项目技术知识点
  20. OA ——办公自动化(转)

热门文章

  1. 计算机软件录音注意事项,录音笔使用注意事项
  2. java中容器里的增删改查_Java工程师的第八天——简单的增删改查的应用
  3. jdk8新特性(二)Stream流式操作
  4. java提高代码质量的小技巧,10个 Javascript 小技巧帮你提升代码质量
  5. 小学阅读方法六种_小学语文重难点|阅读理解的解答技巧+方法(合集)
  6. java redis sadd_Redis Sadd 命令
  7. mac weka连接mysql_weka连接mysqllinux
  8. 如何提取多层json数据 python_Postgre数据库字段Json内容提取(基于Python)
  9. js des加密 java_java JS DES互相加密解密 通用!!!
  10. java中重写hashcode_Java中HashSet要重写equals方法和hashCode方法