关于人机交互,关于AI和AR的未来,我们应该如何看待?

2017年7月9日,由镁客网、振威集团联合主办的“3E‘硬纪元’AI+产业应用创新峰会”在北京国家会议中心盛大开幕。现场200位来自全球AI行业的顶级专家、知名创投机构、创业公司团队和知名媒体齐聚一堂,共谋AI+行业的创新应用,探讨AI的当下与未来。

现场,华捷艾米联合创始人沈瑄给我们带来了主题为“3D视觉系统——打造AR&AI生态”的内容分享。沈瑄表示,未来的人机交互一定是回归到人与人之间交流的本质,即视觉+语音的交互,如此才能相互理解,继而进行充分的交流。此外,关于未来数据应用的方式,在沈瑄看来,无论是AI还是AR,端加云才是真正的未来。

以下为演讲实录(为方便阅读,有所删减):

大家下午好,我是南京华捷艾米的沈瑄,刚才前几位嘉宾已经给大家分享了非常多的干货,其实人工智能的概念非常的广阔,而我们只是参与了其中的一部分:机器视觉。对于机器视觉这个概念我们也觉得非常的大,从这个车牌的识别到人脸的识别,这都是属于机器视觉,而我们做的是一个3D的一个视觉。

未来的人机交互是视觉+语音

我们说一下人机交互,尤其是人与机器人的交互。包括成人和小孩在内,其实我们大家都有一个机器人梦,从星球大战到钢铁侠,从变形金刚到阿童木,到大白,到哆啦A梦,我们都希望身边有一个机器人可以在生活、学习或者工作中去帮我们解决各种各样的问题。这就需要说到人与机器是怎么交互的。

这就是人与机器交互的一个历史。在50年代,我们通过键盘产生人与人、人与机器的交互,在下一阶段有了windows,我们通过鼠标人与机器去交互,而在2000年左右的时候,苹果的iPhone出来了,我们通过touch、通过触摸即可实现人与机器的交互。

我们说现在再下一代人与机器是怎样去交互?是视觉加语音,回到人与人之间沟通的本质。比如说我现在跟大家在交流,通过我的脸部、手势,通过我的肢体语言,大家能互相理解,去充分的交流。人机以“自然语言”的方式交互,包括语音交互、语音沟通作为基础,还包括人脸、图像、手势、虹膜、体感等等。

无论是AI还是AR,端加云才是未来真正的解决方案

然后我介绍一下我们公司在3D、AR上面的一些工作。我们公司认为,AR是人工智能在下一阶段能够应用的一个比较好的行业。苹果CEO库克也说过,AR具有无限的想象空间,它打破了虚拟世界与真实世界的一个界限,是下一代人与机器交互的一个新的模式。

我们认为AR的体系应该分成三个步骤去实现:第一是基础技术,包括3D的实时测量、V-slam、人体动作识别和手势识别等等,这些基本的一些活动的元素;到了第二代会具备一些娱乐性的要素,包括换脸、3D美颜等;最后一步则是会实现真正智能化的AR的系统,那可以通过身高、体型、年龄、性别甚至情绪的识别、通过深度学习以及物联网等各种新的技术来达到最终的一个智能化AR系统。

我们现在的芯片是把所有的数据放在里面,主要是在端这边来识别跟计算,而在未来,我们会把云端去打通,也是基于思科在2015年提出的雾计算或者是边缘化计算的这种理想。现在的移动化设备人人都有,全球可能有20亿部手机,到了一定阶段,这个数量会乘以至少7到8倍,也就意味着有140亿到150亿的终端要连接到云端,而其中所需的传输能力跟计算能力是现在的基础架构所实现不了的。思科在15年的时候提出了这个雾计算,就是在IOT的智能终端上把更多的计算,尤其是前端的一些计算放在端的芯片里,然后实时去上传一些预处理以后的数据,而从云端下载下来的是更新过的通过深度计算更新过的一些算法的模型。

所以我们认为,无论是人工智能还是AR,端加云才是未来真正的解决方案,通过终端上传数据到云下载数据,这种简单的模式肯定是远远不够的。

原文发布时间:2017-07-18 17:19
本文作者:韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。

硬纪元AI峰会实录|华捷艾米沈瑄:端加云才是AI和AR的未来相关推荐

  1. 华捷艾米王亚楠:3D MR让未来无限可能

    (华捷艾米王亚楠:3D MR让未来无限可能) 11月16日,华捷艾米受邀出席了以"软硬兼"摄",听·见AI"为主题的"2018重庆·国际AI Phon ...

  2. 华捷艾米a200摄像头_华捷艾米:3D MR打破行业边界,优化产业结构,让生活更美好...

    原标题:华捷艾米:3D MR打破行业边界,优化产业结构,让生活更美好 12月18日,由北京师范大学新闻传播学院和人民网主办,华捷艾米等联合主办的第三届中国VR/AR/MR创作大赛金铎奖颁奖典礼在北师大 ...

  3. 市场上各种深度摄像头测试之华捷艾米A100

    系统要求.系统配置.开发环境 Windows XP 及以后,X86(32/64bit) Ubuntu 12.04 及以后,X86(32/64bit) CPU 奔腾 4,1.4GHz 及以上 内存 51 ...

  4. 2022年端边云协同的AI视觉产业研究报告

    AI视觉丨研究报告 核心摘要: AI视觉产业背景:AI视觉又称计算机视觉,得益于深度学习技术的快速发展,已于安防.金融.制造.零售等多领域实现规模化商用.2022年,AI视觉相关投融资热潮全面复苏,通 ...

  5. 硬纪元AI峰会实录|暴风集团副总裁王刚:让虚拟人代替你去做很多事

    通过人工智能技术,我们可以完成建模.语音合成.记忆的融入等步骤,打造一套拥有个人身形.声音.动作以及思维方式的虚拟人. 2017年7月9日,由镁客网.振威集团联合主办的"3E'硬纪元'AI+ ...

  6. 硬纪元干货|appMagics伏英娜:优质IP和直播内容嫁接,带来全新AR体验

    appMagics通过算法将AR技术与视频直播相结合,用技术把一些很magic的东西带入每个人的生活中. 5月18日,由镁客网.IT耳朵联合举办的"2017中国VR/AR产业应用创新峰会&q ...

  7. 当初的愿望实现了吗?看华为云普惠AI这一年

    每当有这位领导参加的媒体见面会,我都异常期待,这位领导就是华为公司副总裁.云BU总裁郑叶来. 日前,"华为云普惠AI"年度峰会在北京举行,郑叶来发布了华为云全新品牌口号:" ...

  8. 阿里巴巴从云第一到AI第一的必然性

    文|李永华 来源丨智能相对论(ID:aixdlun) AI到底谁才是行业第一,很多人在追问这个问题,很长一段时间谁也给不出令多数人信服的答案. 作为一个复杂.综合的未来社会趋势,评价AI谁最领先很难有 ...

  9. 华为云普惠AI:把人工智能变成“水电煤气”

    我们对AI是如何认知的?是曾经被封神的Alpha Go?是幻想中的无人驾驶技术?还是一串串密密麻麻的代码?总之,AI曾经是遥不可及.高冷且昂贵的.不过,2018年5月华为云提出了这样一个畅想:让AI走 ...

最新文章

  1. python 图像相似 phash和compare_ssim比较
  2. mysql goto,如何在MySQL存储函数中使用goto标签
  3. 管理者必看!深度剖析BI与数据仓库,企业能否成功转型就看它
  4. 西单大悦城苹果店4s_“神秘列车”复活!金融街-西单,3号免费专线今天回归...
  5. Hive 老当益庄 | 深度解读 Flink 1.11:流批一体 Hive 数仓
  6. The Use Case Definition in UML
  7. 【git】Git 提示fatal: remote origin already exists 错误解决办法
  8. NodeJs——(8)http.ServerRequest的过程
  9. my97中文乱码问题
  10. 如何构建自己的游戏框架并且制作游戏(一)(附源码)
  11. 使用深度学习自动给图片生成文字描述
  12. 分享WEB快速开发工具
  13. 过去式加ed的发音_关于动词过去式+ED的发音 动词过去式发音规则
  14. # Day15-Java基础
  15. abc F - Endless Walk
  16. uniapp苹果支付
  17. [Python]提取docx/网页超链接
  18. 第三届艺星超级品牌日钜献·世界名曲音乐会,全网直播!
  19. Linux主流桌面环境简单介绍
  20. BMP与JPG图片格式的互相转换

热门文章

  1. 入手评测 r5 5600x和r7 5700g选哪个好
  2. 王者荣耀静态页面头部代码设计(1)
  3. 火山PC工具条使用案例教程
  4. VJC案例-叫人起床
  5. vc++2010调试运行没有界面显示
  6. 按钮查询方式控制交通灯c语言程序,单片机控制交通灯(内含程序和实物图)
  7. oracle8i substr,Oracle中INSTR和SUBSTR的用法
  8. 基础知识-计算机网络-应用层
  9. 实现了代码自动生成,开发效率妥妥的提升,升职加薪跟上
  10. 数据sqlite 矢量切片_矢量切片(Vector tile)