语音交互事关未来,国内外已经不少公司在抢蛋糕了,大公司收购、投资、合作不断,就可见一斑。目前,基本上所有的巨头都有涉足。

Apple

2014年7月,有消息称,苹果正在联系多位语音识别技术的专家,正在招聘经理、小组负责人、研究员,很可能将成立一支强大的语音识别团队,并最终取代现在的Siri技术服务商Nuance。过去几年中,苹果招聘了多名此前供职于Nuance的的高层次语音技术研究员,包括前研究副总裁拉里·吉利克(Larry Gillick)、Siri的项目经理贡纳尔·艾弗曼(Gunnar Evermann)、微软语音识别项目高管亚历克斯·阿赛洛(Alex Acero)。

在2013年,苹果收购了自动语音识别公司Novauris Technologies。Novauris是英国研究机构Dragon Systems旗下的附属公司,以语音听写识别著称,成立于2012年。当然,怎么能忘了最著名的那笔收购呢,2010年4月,以1.5-2.5亿美元收购了Siri。

Google

Google在2014年收购了SR Tech Group的多项语音识别相关的专利,其中包括“搜索引擎语音界面”和“修改、更新语音识别项目系统”的专利。

Google一直致力于投资语音搜索技术,以期与苹果公司的Siri展开竞争。2011年,Google收购语音通信技术公司SayNow和语音合成技术Phonetic Arts。 其中,SayNow创建于2005年,可以把语音通信、点对点对话、以及群组通话和社交应用整合在一起,支持的设备包括PC浏览器、智能手机乃至座机。被收购时,有1500万用户,旗下产品包括SayNow Phone,SayNow广播,Big Call以及Chit Chat等。

Facebook

语音交互解决方案服务商 Wit.ai要做的就是重写互联网的语音层,简单地在第三方App中加入几行代码来为它生成一个语音交互界面,就能把语言转化成可以操作的数据。正如移动支付公司Stripe通过几行代码就为网站解决了线上支付问题一样。Wit.ai称,它比Siri更灵敏精确,不需要开发者先期投资,或训练数据集,而且可以应用在移动应用程序(iOS、Android等平台)、穿戴设备和机器人以及几乎任何你可以想到的智能设备。被收购时,Wit.ai成立才18个月,吸引了6000多名开发者,创建的应用超过了数百个。此次收购有助于提高Facebook整体对自然语言的理解能力。

除了Wit.ai,Facebook还在2013年收购了语音识别公司Mobile Technologies。MT创建于2001年,在2009年推出了Jibbigo应用,允许用户在25种语言中进行选择,使用一种语言进行语音片段录制或文本输入,然后将翻译显示在屏幕上,根据你选择的语言大声读出来。

Amazon

2011年,Amazon收购语音识别公司Yap。Yap成立于2006年,主要提供语音转文本服务,代表应用是Yap语音邮件。利用Yap的技术亚马逊建立自己的语音技术平台,服务于亚马逊的网上搜索和客户服务等领域。

2012年,Amazon收购语音技术公司Evi。Evi是一家应该创业公司,原名True Knowledge,在获得了Nuance语音识别技术的授权后,基于自主的自然语言搜索引擎开发了一款与苹果Siri类似的应用。

2013年,Amazon收购语音技术公司Ivona Software。Ivona是一家波兰公司,是Nuance的竞争对手,主要做文本语音转换,被收购时支持17种语言44种声音。

Intel

2013年,英特尔收购了语音识别技术公司Indisys。这是一家西班牙公司,但自称一直在做多语音。在计算语言学、人工智能、认知科学和机器学习领域有研究,不少西班牙公司都采购了他们家的技术。此外,他们还开发了与苹果Siri相似的助手界面。

Samsung

关于三星和Nuance的绯闻已经传了段时间。Nuance的语音识别技术在智能手机、电视和GPS导航设备上都有广泛应用,比如苹果的Siri就是用的它的技术;其他一些企业级市场也有需要用到语音识别的地方,比如医院里的电子病历业务,医生直接口述就能生成电子病历。2013年9月份时,Nuance还同三星达成合作。

Yahoo

2013年12月,雅虎收购了自然语言处理技术初创公司SkyPhrase。Gmail和Twitter的相关技术支持就是SkyPhrase提供的,允许用户跟机器说“人话”得到个性化的搜索结果。比如“NANA发的带图微博”,或者“Jane发给我的包含照片的电子邮件”——这样复杂的信息Siri是理解不动的。SkyPhrase还开发了两款应用,其中一款能让用户查看梦幻足球的比分统计数据,另一款应用与Google Analytics整合发挥作用。

为了推雅虎语音助手,雅虎还找到了合作伙伴Robin Labs,后者主要做自然语言识别和导航。除开发自己的私人助手的导航应用外,现在它还为客户提供语音助手白标产品的开发。”也就是说,理论上讲,每个应用都可以添加一个特定的语音助手模块。既然雅虎语音助手其实是Robin Labs开发的,那它会被收购么?

其实,除了这些大公司和被他们收购的小公司,还有几家初创公司做的也挺有意思。

初创公司

Beyond Verbal(可语音识别情绪的公司)

Beyond Verbal是一家以色列公司,成立于2012年,在情绪识别领域一直领先。Beyond Verbal系统创建的算法可以通过识别音域变化,从而分析出像愤怒、焦虑、幸福或满足等情绪,心情、态度的细微差别也能被识别到。Beyond Verbal的情绪识别系统可以分析出11个类别,400个复杂情绪的变量。

2013年1月,他们开发的情绪识别app moodies在iOS平台发布;2014年8月,他们开发moodies的安卓版。2013年5月,获得了280万美元融资;2013年7月,又获得了100万追加融资。2014年9月,又追加了330万美元种子融资。

在2014年耶路撒冷召开的TEDMEDLive上,就引入了Beyond Verbal的技术来对所有与会人员的情绪进行分析,进而总结整个会议的整体反馈情况。

EI(英国语音识别初创企业)

英国的初创企业EI Technologies也是一家做语音情绪识别的公司,可以分析人声的音调,监控用户的情绪。之前从孵化器Wayra London和英国政府的Technology Strategy Board拿到了15万英镑的种子期融资。

目前系统可识别5种基本情绪:高兴、悲伤、害怕、愤怒及无感情。识别的准确率约为70-80%左右,这个数字要高于人类60%的平均水平。而受过训练的心理学家的判断准确率约为70%,从这些数据来看,EI的算法准确率已经非常可观。其未来目标是进一步提高到80-90%。

通过识别并恰当响应语言内容和情绪来增强自然语言处理算法似乎是人工智能系统的下一步发展方向。《银翼杀手》里面的复制人的致命缺陷正是缺乏“移情(empathy)”能力。现在这三家公司的技术正帮助机器朝着具备“移情”能力迈出一小步—首先学会感受人类的情绪。不过这也是个庞大又复杂的工程。

国外巨头鏖战的新领域——语音识别相关推荐

  1. 国产数据库技术全面破冰,金融核心系统打破国外巨头垄断指日可待

    作者 | 马超 责编 | 伍杏玲 头图 | CSDN下载自东方IC 出品 | CSDN(ID:CSDNnews) 作为一名金融IT人,打造完全自主掌控的金融核心,是我们心中的梦想.年轻的读者可能不太了 ...

  2. 巨头都在争抢无人驾驶 这家智慧停车公司却先上了路 科技事务 百家号 08-14 15:55 今年来,互联网巨头在智慧交通领域动作频频,4月初,百度提出雄心勃勃的“阿波罗计划”,宣布开放自动驾驶平台以

    巨头都在争抢无人驾驶 这家智慧停车公司却先上了路 科技事务 百家号 08-14 15:55 今年来,互联网巨头在智慧交通领域动作频频,4月初,百度提出雄心勃勃的"阿波罗计划",宣布 ...

  3. 阿里巴巴云原生应用安全防护实践与 OpenKruise 的新领域

    作者 | 王思宇(酒祝) 来源|阿里巴巴云原生公众号 得益于 Kubernetes 面向终态的理念,云原生架构天然具备高度自动化的能力.然而,面向终态的自动化是一把"双刃剑",它既 ...

  4. 今天给大家推荐一个深挖国内外前端新领域的前端社区

    印记中文(docschina.org)社区致力于打造良好的中文社区环境,我们有着官方授权的中文文档维护及管理权,包括但不限于 React.webpack 等.同时我们推出了 webpack 文档更新期 ...

  5. 以色列网络安全行业的2018年:吸金力爆棚,资本扎堆新领域

    以色列网络安全行业长期以来一直是业界创新解决方案的温床,2018年又是另一个资本较量的年份,早期初创公司筹集的资金比以往更多,达到10.33亿美元,来应对新出现的安全威胁例如保护数量激增的互联网连接设 ...

  6. 苹果或4亿美元收购Shazam 科技巨头杀入流媒体音乐领域

    继上周五全球最大正版流媒体音乐平台Spotify与腾讯音乐完成换股协议之后,苹果公司于当地时间12月11日确认计划收购音乐识别软件Shazam. 苹果并未透露此次交易的金额,但据科技媒体Recode报 ...

  7. Cell | 小基因开启微生物组研究新领域——大规模鉴定微生物基因组编码的小蛋白质...

    撰文 | 617 责编 | 兮 近年来,随着测序技术的发展,微生物组研究成为一个新热点.借助宏基因组测序技术,我们在人体的不同部位发现了多种多样的微生物,但是微生物究竟通过什么机制发挥作用影响表型呢? ...

  8. 他入狱10年自学数学,如今凭借手稿发了篇论文,被同行评价“足以开辟数论新领域”...

    杨净 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 2010年,他因吸毒.杀人被捕入狱,被判有期徒刑25年. 在狱中,他靠自学数学打发时间. 没有计算机.没有老师,单靠手写.以及数学教材 ...

  9. 通域消化内镜Android患者版,市中心医院消化内科Ⅰ病区开创超声内镜治疗新领域...

    胃底静脉曲张常见于肝硬化患者,易反复出现消化道出血症状,严重时危及生命.由于大部分肝硬化患者肝功能储备和手术耐受性差,内镜下组织胶黏合剂注射治疗是常用治疗方法.但对于合并较大直径的分流道患者来说,组织 ...

最新文章

  1. 正則表達式截取字符串两字符间的内容
  2. Linux下CMake简明教程(五)正规一点的组织结构
  3. 每周一起读 × 招募 | WWW 2019:基于层次化强化学习的多源搜索展示优化
  4. AAAI 2018论文解读 | 基于文档级问答任务的新注意力模型
  5. Go Modules 的智障版本选择
  6. Spring-IOC XML 配置多个相同 ID 的 bean 加载分析
  7. [html] H5播放的video视频,如何实现对视频截图?
  8. 怎样让公式编号不从1开始
  9. C#巧妙实现服务器端应用程序和asp网页交互
  10. 每日算法之三十五:Wildcard Matching
  11. ppt使用vba编写倒计时_在Office VBA宏中使用计时器
  12. linux网络延迟命令,2. Linux使用ping命令查看网络延迟
  13. 知识图谱发展的难点 构建行业知识图谱的重要性
  14. 关于linux下的xinetd服务
  15. openfire入门
  16. 河道水面漂浮物垃圾识别监测 yolov7
  17. 对spring boot yml配置文件敏感信息加密处理的两种方式
  18. 2020-CIKM-DisenHAN: Disentangled Heterogeneous Graph Attention Network for Recommendation
  19. softlayer iso_在IBM SoftLayer上使用Datameer从大数据中获得敏锐的见解
  20. 极点五笔for linux

热门文章

  1. [NOIP2017 TG D2T2]宝藏(模拟退火)
  2. nodejs笔记五--MongoDB基本环境配置及增删改查;
  3. 查看现有运行的linux服务器有多少内存条
  4. vim 执行shell命令技巧
  5. JAVA作业-简易计算器
  6. java中各种运算符
  7. c#调用javascript的方法,有Updatepanel的情况
  8. CCF201903-5 317号子任务(100分题解链接)
  9. HDU3348 coins【贪心】
  10. UVA10990 Another New Function【欧拉函数打表】