Companies and Markets的评估报告称,未来全球语音识别市场将会变得更加多样化,同时软件准确度上会有大幅提升。预计在 2017 年以前,这一块的市场将达到 1330 亿美元。

Companies and Markets的评估报告称,未来全球语音识别市场将会变得更加多样化,同时软件准确度上会有大幅提升。预计在 2017 年以前,这一块的市场将达到 1330 亿美元。看过电影《Her》的朋友一定会对其中语音识别和控制的情节印象深刻,我们此前详细介绍过这项技术实现的难点,但在看得到的未来,语音识别技术究竟应用于哪些场景呢?

提起语音识别,我们最容易想到的可能是不会讲笑话的 Siri。Siri 的技术来自Nuance,世界上第一家上市的语音识别公司。几个星期前有传闻说百度欲收购 Nuance 助力自己的语音助手应用,但此事已被百度深度学习实验室(IDL)主任余凯否认。去年 11 月也曾传出三星曾与 Nuance 商谈收购事宜,却被其连续亏损六个月的状况吓退的新闻。另一方面,苹果并不想一直依赖 Nuance 的技术,进行了一系列自组队活动,这也促使 Nuance 寻找新的出口。

语音识别作为一项很难直接带来现金流的业务,让 Nuance 操碎了心。公司整体状况虽然不容乐观,但我们依然看得到 Nuance 一直以来在不同领域商业化上的尝试。

医疗领域

前一段时间,Nuance 在其官方博客上,公布了将发力医疗领域的消息。不仅是简单的通过智能手表追踪运动情况和心率,还有直接根据人的身体状况匹配相应的服务如合适的餐厅或食物等,当然这些大多是基于可穿戴设备的。另外他们还考虑到更多场景,诸如紧急语音求助,医患对话存档,呼叫中心的对话听写等。

由于医疗领域词汇库专业性强演变性弱,只要建立完整的数据库,就可以做到对疾病名称、药品名称相对精确的识别。国内已有的应用如病历夹与珍立拍,为医生提供一个安全存储病历资料的云空间,方便查找病例,支持语音搜索功能。

智能车载

行车安全问题上一直聚焦了很多目光,去年有人曾经设计出一个车载屏幕,可以利用多指的简单手势解决司机操作触摸屏过度分散注意力的问题。事实上,Nuance 早已有定制的汽车级语音平台Dragon Drive,并获得了 2015CES 创新大奖。通过将车载平台与手机连接,Nuance 可以帮用户实现语音控制 GPS 导航,信息收发,电话接打,社交网络更新等等。

智能可穿戴

北京的冬天越来越冷,有无数次需要用手机却死活不想伸手。打电话,发微信,查路线,叫车,这些如果都可以用一个可穿戴设备通过语音控制实现,那该多好埃目前出门问问团队以做出搭载 Moto 360 的智能手表操作系统Ticwear,可以实现直接语音控制滴滴打车。

早在一年前,Intel 就开发出可穿戴设备原型 Jarvis,可戴在耳朵上之后连入手机,以此实现听懂主人发出的指令、给予语音反馈的功能,充当类似 Siri 的个人语音助手角色。这不就是《Her》里面的场景么!

之前我们介绍了一款叫 Luna 的智能床罩,想要以一种全新的方式收集更多人体数据,同时整合各种智能家居。语音识别或许是最适合成为整合入口的方式,尤其当我们躺在床上完全不想看任何屏幕的时候。何况,Nuance 早就研发出可以语音控制电视、手机的技术。

“谁能用互联网思维改造一下家庭浴室,每次进去都要揣个扬声器很麻烦的,况且切首歌,接个临时电话简直是反人类。”智能家庭浴室虽然还没有听说,不过可以通过语音操控的智能音箱已经有了。

教育领域

之前我们提过语音识别的难点之一是众多语言和方言的差异化。这一点反过来看,可以成为其在教育领域的应用。让数据库提供一个标准,可以为口语评测提供一种更加简便高效的方式。

在辅助学习方面,我想起一年前的36氪开放日上海站,“紫冬口译”这款基于云识别的中英文同声翻译应用。它集成了语音翻译、语音识别和语音合成技术。你只需对着手机说出想要翻译的句子,即可得到中英文双重语音播读结果和可视的文本结果。它支持连续的语音输入,甚至可以根据你的语气自动为你添加标点符号。

总而言之,说话是人类最自然的交流方式,我们可以说人工智能是伪智能,机器永远不会像人一样去活着,但机器可以变得越来越善解人意。

未来,语音识别可能应用于哪些商业化场景?相关推荐

  1. 【人工智能沙龙】未来,语音识别可能应用于哪些商业化场景?

    近日,Companies and Markets的评估报告称,未来全球语音识别市场将会变得更加多样化,同时软件准确度上会有大幅提升.预计在2017年以前,这一块的市场将达到1330亿美元.看过电影&l ...

  2. 语音识别方案 - 联想语音团队多场景实时语音文字转换方案

    [本文转载自联想乐语音论坛] 语音技术一直是人工智能的重要领域之一,其应用也日益广泛.语音技术本身也包括许多细分领域,如远场语音识别.副语言语音属性.说话人日志.声纹识别防欺骗攻击和零资源TTS等. ...

  3. 推荐算法在招聘商业化场景中的应用实践

    今天给大家带来58同城商业生态与智能发展中心-变现策略部算法架构师祝凯文所做的分享<招聘商业化场景中的推荐算法应用实践.pdf>,关注招聘推荐.推荐算法.商业hua化等的伙伴们别错过啦!( ...

  4. 未来语音识别技术的发展趋势会如何

    (文章来源:AI科技大本营) 语音识别主要趋于远场化和融合化的方向发展,但在远场可靠性还有很多难点没有突破,比如多轮交互.多人噪杂等场景还有待突破,还有需求较为迫切的人声分离等技术.新的技术应该彻底解 ...

  5. 未来语音识别技术的发展趋势将会怎样

    (文章来源:CSDN) 语音识别主要趋于远场化和融合化的方向发展,但在远场可靠性还有很多难点没有突破,比如多轮交互.多人噪杂等场景还有待突破,还有需求较为迫切的人声分离等技术.新的技术应该彻底解决这些 ...

  6. 低延迟流式语音识别技术在人机语音交互场景中的实践

    美团语音交互部针对交互场景下的低延迟语音识别需求,提出了一种全新的低出字延迟流式语音识别方案.本方法将降低延迟问题转换成一个知识蒸馏过程,极大地简化了延迟优化的难度,仅通过一个正则项损失函数就使得模型 ...

  7. 干货 | 语音识别类产品细分及其应用场景

    让机器能听会说.能理解会思考还远吗?首先要实现的,就是"听"的功能. 芝麻开门! 你的童年是否也曾这样对着大门发出命令? 当然,大门用静止表示对你的"忽视".乐 ...

  8. 科技赋能数字未来,为企业搭建数智化场景,构建数字生态

    随着数字经济与智慧社会的快速发展,企业数字化需求爆发性增长,数字化已不再是大型企业的专项,不少成长型企业正逐步将数字技术融入平台.产品.销售.管理等环节,数字化的快速发展,促使金融.互联网.零售等企业 ...

  9. 语音识别技术的研究难点以及未来发展方向

    (文章来源:钛媒体) 目前,语音识别研究工作进展缓慢,困难具体表现在: (1)输入无法标准统一,比如各地方言的差异,每个人独有的发音习惯等,如下图所示,口腔中元音随着舌头部位的不同可以发出多种音调,如 ...

最新文章

  1. mysql写放大,canvas实现图片根据滑块放大缩小效果
  2. 商城模板网站html5手机端_网站建设中,pc端与手机移动端设计一样吗
  3. linux显示父目录,linux – 仅列出文件的公共父目录
  4. Fluid 0.5 版本发布:开启数据集缓存在线弹性扩缩容之路
  5. Python 内置方法和属性应用:反射和单例
  6. 2019阿里天猫团队Java高级工程师面试题之三轮面试
  7. 鸿蒙系统8月9日发布,8月9日,华为发布EMUI10.0系统+展示鸿蒙系统
  8. 程序员怎么看待C语言?最伟大?最落后?
  9. python带我起飞_Python带我起飞:入门、进阶、商业实战
  10. (65)FPGA面试题-状态机编码选择原则?
  11. AttributeError: module 'tensorflow' has no attribute 'Session'
  12. 深入理解JavaScript定时器
  13. python爬取豆丁网文章_百度文库爬取分析 - osc_tgjycqas的个人空间 - OSCHINA - 中文开源技术交流社区...
  14. rfm模型python_使用python实现RFM模型
  15. ffmpeg 多张图片合成h264编码格式的视频 按照指定时间截取 并添加 acc编码格式音乐 IOS可播放
  16. 培训机构要不要去 适合谁去
  17. 深度(Deepin)系统二三事
  18. 笔记本电脑的键盘灯如何关
  19. 付宇泽20190919-2 功能测试
  20. STM32 PWM控制舵机——原理、接线、源程序

热门文章

  1. 八 Civil3d常用显示样式的编辑与创建 ----点标签样式2
  2. 一、JpaRepository 命名规范(摘)
  3. 0. 跟踪标记 (Trace Flag) 简介
  4. 校企合作与集成电路--华为在行动
  5. POJ3619 Speed Reading【水题】
  6. Bailian4045 与3和5无关的数【进制+模除】
  7. Competitive Programming专题题解(1)
  8. HDU1860 统计字符【水题+输入输出】
  9. 奇妙的证明 —— 0! = 1(a^0=1)
  10. node.js 安装及配置(hello world)及 node 的包管理器(npm)