人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。我们行业(UXPA)观察站首位采访的嘉宾是:龙梦竹Shiny——思必驰市场总监

思必驰由剑桥大学团队创建于2007年,2008年回国创业,是国内唯一拥有人机对话技术,国际上极少数拥有自主产权,中英文综合语音技术的公司之一,先后获得三轮融资。思必驰是国内唯一专注于智能硬件领域的语音公司,主要面向智能硬件三个垂直领域:智能车载、智能家居和智能机器人,提供智能语言交互解决方案。
 
Q&A 
Q1:您对人工智能是持有怎么一个理解呢?您可以从思必驰比较擅长的智能语音这个领域出发来来谈。
龙梦竹:人工智能这个行业,国内现在特别地关注,但整个的发展已经60多年了。人工智能的话,你要辩证来看,语音智能只是人工智能这个大领域下的多模态交互方面的一环,多模态交互除了语音以外也包括像机器视觉、手势、体感等等,只是语音智能作为最天然的交互入口、最天然的一种交互方式,因此更多地被大家所关注。这两年除了语音智能以外,包括机器视觉,算法上的深度学习,监督模型等等,也是被大家所关注着,现在只是恰好到了人工智能最旺盛的时候。

Q2:思必驰的定位是专注人性化的智能语音交互技术,那怎么理解这个个性化智能语音呢?
龙梦竹:个性化智能语音和场景是一个意思。因为我们在说每一句话,在每一个不同的环境下,他的意思可能是不一样的。比如你在车里开车的时候,你要说一句我饿了,那你在车里对你的车载产品说这句话,你的目的肯定是导航,想找一下餐厅。那你在家里,如果对你的音箱说我饿了,你不会希望音箱给你导航吧,那你需要的可能是订餐。你如果对一个机器人说我饿了,那你有可能是想调戏它,跟它玩。就是我们要打造个性化的产品体验,根据产品跟受众、还有场景的不一样,去做不一样的交互方式。

Q3:思必驰主要是做三个垂直领域:智能车载、智能家居和智能机器人。那目前来看,您觉得这三条线,思必驰发展得最快或者是最有前景的是哪一条?
龙梦竹:现在在我们三大业务领域里,我们在车载后装已经站稳了第一。从去年下半年到现在一直在持续发力的是家居方向。因为这两块场景是未来我们的主打三个业务里面的最前的两个方向。车载目前的饱和度和保有率会特别高,家居非常有前景。因为家居的产品,内部会更多。第二是家居产品的受众的基数肯定是比车载的基数要大的。

Q4:关于会话式交互,思必驰在做这个语音类产品的时候,有没有专门的人来做规划设计,或者说有没有专门考虑到用户体验这个问题?
龙梦竹:从技术上讲,我们有专门的产品部门,是在做整个对话设计的流程。因为语言是没有界面的,但现在很多产品都会配合界面,那么如何让界面显示,如何让语音这种无屏的交互和有屏的产品结合起来,这一块我们是有专门的UI设计。比如怎样的界面对用户来说会更友好,尽量的让每一个界面反馈方式能够让人机交互变得更顺畅,这个是从非技术的角度,从UI的角度去考虑的。

Q5:我们知道voice designer在硅谷是比较抢手的,现阶思必驰有没有考虑找一些专门做语音交互的设计师来帮助我们提升产品体验这一块呢?
龙梦竹:这块未来会是一个重点,现在需求还没有那么高,因为毕竟现在国内这一块以中文为核心的语音交互还在一个大发展的时期,最核心的问题还在技术能力上。关于外部的,包括我们刚刚提到的,现在也会越来越重视整个产品的体验,包括我们在UI界面上也会越来越重视,但是到现在为止,它的核心挑战力还是在底层的技术方向。而且包括你说的voice designer这一块,它其实也是偏技术的。

Q6:那您觉得现在国内,智能语音这个行业的发展情况是怎样子的?
龙梦竹:做中文最好的语音公司,也没有疑问,是在中国。在国内,做语音的龙头企业是科大讯飞。但是从识别率的角度上来讲,现在所有的公司,包括一些规模比我们小的公司,在识别率上其实是相差无几的。而语音技术,它本身是没有盈利模式,没有应用方向,它一定是跟具体的场景、环境和产品结合以后,它才会变得有意义。那么结合到业务领域来看的话,包括科大讯飞、微软、百度,没有哪一家能说自己是最好的。我们以讯飞为例,讯飞的最大的优势在于它识别的语种特别多,因为讯飞有很强烈的政府背景的因素,它的方言识别能够支持40多种,而百度有20多种。相对它们而言,我们是没有做单独的方言识别优化的。我们支持的是带方言的普通话,就是在普通话的范围内做方言的矫正。讯飞在业务领域在教育、医疗方向,它绝对是老大,但在互联网方向,它们的量可能还没有我们大。讯飞虽说总体体量最大,但它在不同的方向下会面临着不同的竞争对手。百度的优势在于通用用户下的识别搜索,但是在具体的业务场景里面,比如说在教育领域,它肯定比不过讯飞,在银行客服领域,它比不过捷通华声。每个领域下其实都有一两家是比较突出的。

Q7:那在您看来,目前我们的交互发展水平到了什么程度?已经可以产品化运用到我们的生活当中了,还是仅仅是停留在一些概念性的demo层面?
龙梦竹:早就已经应用了,现在所谓的demo概念层面是一些新的前沿技术,有的还在实验室阶段。但是整个语音人机交互早就已经进入到我们的生活中,而且是各个领域都有。比如医疗领域,现在百度、讯飞都在做的一件事就是用语音来输入电子病历。教育领域,像口语评测,讯飞在这个方向做得最好,在高考和各种考试中已经开始普及。

Q8:那您觉得国内国外在语音智能这一块的发展方向或者是发展重点上有什么不同吗?
龙梦竹:这块其实还真没有什么不同,基本上现在大家在做的都是对话,做多人情景的理解和语义。随着人工智能的火热,越来越多的创业公司也在做这些内容,但稍微不一样的是,现在的创业公司可能没有了我们当年的机会去做这种从底层技术、到实验室研发到交互到一体化的这种能力。现在很多的创业公司更多的是在做比我们还要单点垂直,还要细分的方向。比如新的创业公司只做这个语义理解或者只做麦克风阵列,做里面的芯片模块,或者是只做合成这一块,对他们来讲的话还会有一些新的机会。从前沿技术来看,包括百度、讯飞,包括我们,大家现在基本上都是在做声纹,或者是去解决远场交互的问题,解决语义理解。方向其实大同小异,因为语音的几个基本点都是围绕这几个点去解决实际场景下的问题,所以方向大概都是一样的。

Q9:最后一个问题。您觉得语音交互行业未来的发展趋势还有前景是怎样的呢?
龙梦竹:像我们刚刚其实在提的一个前景,就是说从单一的模态交互向多模态的交互发展。这其实是说语音是入口,有一个概念层次就是这个意思,可能会在语音的基础上会加更多的模态识别和交互。第一个方向是从单一的模态交互向多模态的交互来发展。比如说车里的防疲劳的辅助驾驶,通过影像的识别配合声音,用语音交互来做更便捷的交互方式,用虹膜,机器视觉来判断疲劳驾驶所辅助。比如机器人,通过声音确定用户方向,通过面部识别抓取,锁定用户行动轨迹。现在很多的产品已经在用多模态交互的方式来做人际交互的体验了。第二个方向是从被动式交互方式到主动式,甚至更加个性化的服务。现在我们都是先对机器发出指令,机器才会反馈你。那么未来,机器就可以根据用户的一些需求,随时分辨并智能推荐。第三个从技术上来讲,声纹识别技术发展会对人际交互的体验有很大改善。比如在什么时候它通过什么样的办法来判断你的性别,你的情绪。这些就是真正的个性化智能服务,这块是跟底层技术等各个方向分不开的,我觉得这个是整个语音发展的三个大的方向。
 
UXPA中国成立于2004年,是中国本土的第一个非盈利性用户体验行业协会组织。UXPA中国致力于推动用户体验在中国的发展提高,提供一个专业的交流和学习平台,为中国最具影响力的用户体验组织。经过13年的努力,UXPA中国在中国用户体验行业具有相当高的知名度及影响力,UXPA中国组织的活动或项目也获得国内外企业及行业人士的高度认可,聚集一大批大部分活跃在中国的用户体验专业人员、产品经理、关注用户体验行业发展的人群。

原文来自公众号UXPA(ID:uxpachina)
大连中钰睿泓与你分享精品文章

智能新时代-不一样的人机交互体验相关推荐

  1. 石头机器人红灯快闪_机器人集体“快闪”活动爆红网络 “我是AI”与您相约智能新时代...

    原标题:机器人集体"快闪"活动爆红网络 "我是AI"与您相约智能新时代 3月10日下午,天津科学技术馆内,悠扬美妙的歌声<我和我的祖国>突然响起,随 ...

  2. 【观察】智能+新时代,智慧酒店未来该何去何从?

    申耀的科技观察 读懂科技,赢取未来! 理查德·沃特森在<智能化社会:未来人们如何生活.相恋和思考>一书中所说:"几千年以来我们使用技术来增强现实--一旦完美塑造了工具,工具也会反 ...

  3. 电子行业:万物互联,开启智能新时代

    原标题:电子行业:万物互联,开启智能新时代-20210715-兴业证券-56页 来源 | 兴业证券 云管端量变到质变.5G.WiFi和蓝牙等云和管端大幅升级,带来物联网连接量大幅增长.边缘云.云计算等 ...

  4. 数字智能新时代,IT基础设施,Are you ready?

    数字智能新时代,不变的唯有变化. 作为与Linux Kernel.Chromium并列为全球贡献度最活跃的三大开源项目之一,OpenStack用十年时间构建丰富计算.存储及网络核心功能的同时也借助开源 ...

  5. GVS案例分享|乘新时代姑苏舫号,体验匠心智能控制

    水,是苏州的灵魂,串起苏州的古与今.动与静.金鸡湖景区位于苏州工业园区,总面积11.5平方公里,其中水域面积7.4平方公里. 新时代姑苏舫号,是金鸡湖景区极具苏式特征且规格超高的游览船型.船体分为上下 ...

  6. 酒店行业步入智能新时代 洲际酒店集团与Aruba共赴数字化转型之旅

    从网络基础设施入手,洲际酒店集团携手Aruba打造智慧酒店新样板. 出品 | 常言道 作者 | 丁常彦 作为魔都上海的新晋网红打卡地,"深坑酒店"已经成为游客来上海打卡的标配.从2 ...

  7. 谋时而动 顺势而为 “软件定义智能新时代”

    6月12日,第十六届中国国际软件和信息服务交易会在辽宁省大连市开幕.来自中国.以色列.美国.加拿大.日本.韩国等30余个国家和地区的750余家海外企业和国内领军企业参展. 大会全景图 商务部在软交会期 ...

  8. 开启元宇宙新时代,VR全景,体验虚拟展厅

    随着数字技术的不断进步和社交媒体的普及,元宇宙成为了当下较热门的话题之一.随着越来越多的人开始关注元宇宙,其在商业领域中的应用也越来越受到关注. 一.元宇宙虚拟展厅的概念 元宇宙虚拟展厅是一种使用数字 ...

  9. 万物互联,开启智能新时代【附下载链接】

    来源 | 兴业证券 5G.WiFi和蓝牙等云和管端大幅升级,带来物联网连接量大幅增长.边缘云.云计算等架构的升级,优化了流量和算力的分布:与此同时,AI芯片近年的技术迭代,大幅提升芯片智能化,物联网智 ...

最新文章

  1. 数据库 1205 Error 'Lock wait timeout exceeded; try restarting transaction' on query
  2. HDU_1253 胜利大逃亡(BFS)
  3. python 四边形分割
  4. 会计转行算法之路(一)会计转程序员
  5. 现在还需要掌握linux文本模式吗?
  6. Win32 API CreateCompatibleDC 函数的相关应用
  7. springboot启动时An attempt was made to call a method that does not exist
  8. 二叉树层次遍历c语言_[LeetCode] 107. 二叉树的层次遍历 II
  9. 进程间的通信----管道
  10. 体制内工作了十几年,跳出来学嵌入式合适吗?
  11. g++ linux 编译开栈_linux下使用g++编译cpp工程
  12. C++_选择结构_单行if语句_多行if语句_多条件if语句_嵌套if语句_三目运算符---C++语言工作笔记016
  13. 第六届开源操作系统年度技术会议将在12月16日杭州浙江大学举办
  14. sonar mysql 配置_Sonar配置与使用
  15. cf鼠标宏数据大全_钛度黑百合电竞定制鼠标,酷炫配置为电竞而生
  16. 基于Python的深度神经网络的中文期刊分类系统
  17. AE学习的艰难困苦历程
  18. php laravel 增删查改,通过 Laravel Eloquent 模型实现简单增删改查操作
  19. 今日份PS练习|油画棒效果
  20. 如何从华为云服务器上找回手机,华为云服务怎么样使用手机找回功能

热门文章

  1. ctf比赛的方向及内容
  2. DGM: A deep learning algorithm for solving partial differential equations
  3. 云计算具有哪些优势 如何快速系统学习云计算
  4. Linux安装RPM、YUM
  5. ubuntu分区大小
  6. 大四计算机系的,毕设该怎么下手?
  7. Entertain Box multiset的应用
  8. 基于Keras2《面向小数据集构建图像分类模型》——Kaggle猫狗数据集
  9. 【比赛报告】2018.10.11校赛[8-2情人节欢乐赛] NOIP练习赛卷十二
  10. 超简单的位运算---再也不用担心看不懂题解了