[摘要]随着语音识别技术准确率的提高,其应用范围也在不断扩大:搜索、购物和发现娱乐内容,对机器说话将很快像对人说话一样司空见惯。

腾讯数码讯据Forbes网站报道,仅仅在7年前,语音识别技术听起来还是一个笑话。

在迪士尼乐园等待乘车的一名女性,给她的丈夫发送了一条语音留言:“I got

the FastPasses”,但显示在她丈夫手机上的信息却成了“In fact, bastard what”。

这是CENT 2009年搜集的Google

Voice闹的“笑话”之一,彰显了语音识别技术的巨大进步。

现代的语音识别技术正在改变人们进行搜索、购物和发现娱乐内容的方式。随着语音助手应用范围不断扩大,对机器说话将很快像对人说话一样司空见惯。

语音识别无所不在

在2017年国际消费电子展上,语音技术无所不在。三星在国际消费电子展上展示了新款电视机QLED

TV,用户对着遥控说话,即可搜索和播放视频内容。同样在这次展会上,亚马逊Alexa语音助手,几乎出现在所有类型电子产品上。

准确率的提高,推动了语音识别技术的普及。据国际消费电子展主办方美国消费技术协会高管肖恩·杜布拉奇称,语音识别系统的错误率由1995年的43%降低到今年的6%。语音识别技术过去30个月的进步,超过之前的30年。

语音识别系统理解和处理语言的能力进步很大,微软首席语音科学家黄学东表示,该公司语音识别系统的准确率已经可以媲美人类。

咨询公司Parks

Associates高级研究主管布雷特·萨平顿表示,语音识别系统准确率提高的原因是,它们采用的人工智能技术得到改进。

不断提升的可用性

Forbes表示,语音识别技术的目标,是使用户能更便利和自然地使用设备。语音识别技术在QLED TV中的应用就是一个例子。

三星产品经理Jihyoung

Jeong表示,“我们数了下改变亮度需要按键的次数——需要按25次。”

通过语音命令控制QLED TV要简单得多:用户可以按住Smart

Remote遥控器上的麦克风按键,口授命令,释放麦克风按键,电视就会显示并执行命令。

现在,用户只需简单地告诉电视机“set brightness to

30”,或100之内的任何数值。Jeong表示,对于观看电影和体育比赛节目来说,亮度有很大影响,但“之前,非专家用户不会想到观看不同类型的节目需要改变亮度”。控制音量也有类似的语音命令。

语音识别技术还使电视机的操纵更为简单。用户无需在屏幕上选择“HDMI

2”等输入类型,只需告诉QLED TV切换到Xbox、Netflix或Spotify即可。

随着技术的发展,语音识别技术更像是服务员而非设备控制器了。如果在观看电影时听到喜欢的歌曲,用户可以按下语音键,向电视提问“这首歌曲的名字是啥?”答案将显示在屏幕上。如果用户安装有Pandora或Spotify等流媒体音乐应用,可以告诉电视机启动应用,播放听到的歌曲。

独立设备还是嵌入式系统?

电视机和亚马逊Echo等智能音箱,能与更多应用和设备相连。语音助手可以订购披萨、报告股价和解释打开照明灯具的语音命令。

但是,许多语音助手都以独立设备的形式存在,并非所有人都喜欢家里再多加一款电子设备。未来,语音助手可能被嵌入在从冰箱到智能手表在内的传感器所取代。三星计划最终把Bixby语音助手安装到电视机、冰箱、空调和其他家用产品中。用户可以简单地站在空调前,告诉它调低温度,而无需使用其他设备。

利用语音进行搜索

目前,大多数人都通过手机认识了语音识别技术。约40%的美国智能手机用户使用语音识别软件。市场研究公司ComScore预测,到2020年,半数互联网搜索将由语音命令启动。

人们在搜索时通过语音和打字输入关键字存在差异。随着语音搜索增加,这一问题让零售商苦恼。最大的挑战在于,语音输入的搜索关键字包含的单词数量超过打字输入。

箱包电商eBags首席技术官迈克·弗拉兹尼表示,“人们在使用语音输入搜索关键字时会说,‘What’s

the best luggage set for a three-week vacation in

Hawaii’”,使用打字输入方式,人们不会输入这么长的搜索关键字。”

这意味着,在处理语音搜索时,设备需要更强大的处理能力,过滤不相干的单词,以提供有用的搜索结果。

为了向使用语音搜索的客户服务,零售商采用了自然语言处理技术——一种能更精确地解释语言细微差别的人工智能技术。计算机能通过上下文更好地理解信息,理解俚语。

Forbes称,语音搜索还使企业获得了独特优势:使用语音搜索的客户会披露更多个人信息。把这些信息与网络档案和搜索习惯结合起来,会提高广告和客户服务的针对性。例如,QLED

TV会根据用户的观看习惯向用户推荐内容。

语音识别技术尚存在不足。它有时需要问后续问题才能搞清楚用户需求。通读显示在屏幕上的搜索结果效率更高。

但是,语音识别系统对用户语音和个人偏好了解越多,它的准确率就越高。由于它在不断进步,因此在帮助我们更好地生活方面有着前所未有的潜力。

精彩视频推荐

语音识别准确率终于提升了 以后可以随时和机器人聊天相关推荐

  1. AI加持 百度输入法语音识别准确率相对提升15%

    7月3日,在2019百度AI开发者大会上,百度首席技术官王海峰在介绍百度大脑AI技术时谈到百度AI能力应用落地的重要产品之一"百度输入法",截止目前,百度输入法日均语音请求量峰值已 ...

  2. 将语音识别准确率提升40% 他是当下最受比尔·盖茨器重的中国人

    原标题:将语音识别准确率提升40% 他是当下最受比尔·盖茨器重的中国人 导语:"你想造一个有意识,又聪明的东西,多生点小孩不就好了." 微软有三大部门.一个是销售单位,它必须要赚今 ...

  3. 一种提升语音识别准确率的方法与流程

    本发明涉及语音识别技术领域,特别涉及一种提升语音识别准确率的方法. 背景技术: 人机交互是通过输入,输出设备,以有效的方式实现人与机器对话的技术.已广泛应用在消费电子,通信,家电,医疗,汽车等各个行业 ...

  4. 当输入法语音识别准确率达97%是怎样一种体验?

    原标题:当输入法语音识别准确率达97%是怎样一种体验? 为何大家都在感叹"语音输入"是一项黑科技?"语音输入"并不是近10年才兴起的新技术,早在上个世纪中期,& ...

  5. 百度、搜狗、讯飞同时宣布语音识别准确率达到97%,他们是怎么做到的?

    导读 11 月 21 日到 23 日,搜狗.百度和科大讯飞三家公司接连召开了三场发布会,向外界展示了自己在语音识别和机器翻译等方面的最新进展.值得注意的是,这三家公司几乎在同一时段宣布了各自中文语音识 ...

  6. 人脸识别准确率大幅度提升

    根据 NIST 2018年发布的成绩,目前全球最好人脸识别技术水平为千万分之一误报下的识别准确率接近 99%(yitu-001),这意味着受限场景下,在千万分位误报上,人类已经将机器的人脸识别能力推向 ...

  7. 远场语音识别,性能提升 30%,百度怎么做到的?

    导语:彻底端到端 ~ "今天我保守报一个30%以上的性能提升,很保守.未来这个技术会再次大幅刷新人们对远场语音的认知.我自己的判断是,三年以内远场语音技术的识别率将达到近场识别率,因为有了这 ...

  8. cnn 准确率无法提升_清华类脑芯片再登Nature: 全球首款基于忆阻器的CNN存算一体芯片...

    传统计算架构中计算与存储在不同电路单元中完成,造成大量数据搬运功耗增加和额外延迟,被认为是冯·诺依曼计算架构的核心瓶颈. 人类的大脑却并非如此,而是直接在记忆体里计算.被认为具有「存算一体」潜力的忆阻 ...

  9. 语音识别准确率永远达不到100%?

    制图:杰伊·本特(Jay Bendt) 撰文 | 韦德·劳什(Wade Roush) 翻译 | 赵剑琳 回首2010年,马特·汤普森(Matt Thompson)在美国国家公共广播网(NPR)的一篇评 ...

最新文章

  1. 新日光Q3收入亏损8400万美元缩水33.85%
  2. OpenAI NLP最新进展:通过无监督学习提升语言理解
  3. mysql 求数据的长度_mysql 如何求数据的长度
  4. 需要在函数中传递的变量
  5. python爬取网易云音乐评论并进行可视化分析
  6. Web框架——Flask系列之request请求参数详解(十一)
  7. 【GRE协议】CentOS配置GRE隧道
  8. 【Oracle】lsnrctl reload 命令简介
  9. 解决布线困难的小方法-----无线路由器变身交换机
  10. struts2 log4j_Struts2和Log4j集成示例项目
  11. 如何使用一套键盘鼠标,同时控制多台电脑?
  12. html页面网页打开乱码怎么解决方法,网页乱码怎么解决?
  13. 无锁(Lock-Free)编程简介及漫谈
  14. 【色彩管理】RGB色彩模式详解
  15. 2021年全球风力发电铸件收入大约1958.1百万美元,预计2028年达到2121百万美元
  16. 大一期末C语言大作业—结构体和链表框架
  17. proposal中文翻译_proposal 是什么意思_proposal 的翻译_音标_读音_用法_例句_爱词霸在线词典...
  18. Go-数字签名详解与Rsa数字签名代码
  19. 红旗颂的感情多么真挚,突然很理解老一代们:-)
  20. html在ie8下跳转新网址,ie8升级到ie11 单击“查看已安装更新”

热门文章

  1. 循环神经网络(LSTM和GRU)(1)
  2. servlet监听器Listener(理论+例子)
  3. Oracle EBS:打开工作日历查看
  4. PHP开发者最好的学习资源收集
  5. GridView 合并列、行类
  6. Bailian4115 鸣人和佐助【BFS】
  7. CCF NOI1005 存款收益
  8. I00004 贝尔三角形(解法二)
  9. Maven 项目管理 —— 安装与配置
  10. PBS 作业调度应用