苹果和谷歌这两大国际IT巨头的战略表明,在智能手机上广泛应用的语音识别技术很快会在汽车上普及。本文以宝马、本田和福特等几个典型汽车厂商的案例介绍语音识别在汽车上的应用,并展望未来发展趋势。

苹果公司iPhone 4S推出的Siri应用语音识别技术,不但可以通过手机读短信、介绍餐厅或者询问天气,还可以回答问题,与用户聊天。这一产品成功地将语音识别技术商业化,给消费者带来了方便和快乐。不仅如此,目前苹果公司已经联合通用雪佛兰、本田、奔驰和沃尔沃等12家全球主要汽车厂商,开发iOS in the Car系统(见图1)。iOS操作系统安装在车内显示屏上,驾驶者可以把iPhone上的功能投射到车载系统的屏幕上,利用Siri语音控制功能,使用iPhone的导航、电话、信息和音乐播放,并且可以通过智能化操作使用手机上的各种功能。车主们在开车的时候,无需动手,就可以通过呼叫Siri—苹果声控车载智能通信助理。iOS in the Car系统提供了Eyes-Free方式播放音乐、打电话、查询地图和阅读短信等功能。

其实在此之前,语音识别技术早已在一些豪华汽车上得以应用,例如2000年宝马汽车就开始应用语音控制技术,操作汽车的电话、导航和收音机等设备。随着技术的进步与普及,如今语音识别功能已经出现在10多万元的国产A级乘用车上,例如2013年中国市场最畅销的福特福克斯轿车上就搭载了SYNC车载多媒体交互系统。

本文仅以宝马、本田和福特等几个汽车厂商的典型案例介绍语音识别技术在汽车上的应用。

宝马汽车的语音控制系统

宝马汽车2000年推出的语音控制系统可以通过多功能方向盘上的专用控制按钮操作(见图2)来识别50余条英语语音指令。

1.打电话

例如拨打电话的过程是,驾驶员说:“Dial phone”,汽车回答:“Please speak number”。然后驾驶员每次读出四位数以下的电话号码,电话号码过长可以分次读出。驾驶员全部确认后,再次说“Dial phone”,汽车语音控制系统就拨出该电话号码。

2.编辑通讯录

驾驶员可以用“Store name”、“Save”、“Delete name”、“Clear name”、“Yes”和“No”等语音命令存储、删除和编辑说出的电话号码。

3.语音记事本

驾驶员用“Record note”和“End of note”命令,对说出的话进行录音记录,然后保存。用“Play note”或“Read note”读取记事本的录音。

4.导航

调用地图的命令是“Route map”,启用导航的命令是“Navigation”,定义地图比例尺命令的一个例子是“Scale 400 feet”,寻找加油站的命令是“Gas station at current location”,保存当前位置的命令是“Save position”。

5.设备音量控制

驾驶员用“Volume up”或“Volume down”来调节音量。

6.语音帮助系统

例如“Help phone”命令可以让系统朗读出所有与打电话相关的命令,如:Dial number、Dial name、Add name、Delete name、Play phonebook、Clear phonebook和Redial。

本田汽车的语音控制系统

早在2004年9月,搭载车载语音识别导航系统的本田汽车就已在北美市场上市,其中2005年款的Acura RL轿车将语音识别系统作为标准配置, 2005年款的Acura MDX和2005年款的Odyssey轿车将其作为选配。

本田汽车的车载语音识别导航系统内置的嵌入式ViaVoice语音识别软件由IBM公司与本田汽车公司联合开发,它不但具备朗读文字的语音合成能力,还具备自动识别驾驶员说出的包含在北美大陆地图数据库中的所有城市和街道名称的英语语音。本田汽车的命令到控制系统可以理解700多条语音指令,控制汽车上的CD、DVD和空调系统等系统,同时可以识别驾驶员读出的导航系统中的170万个城市和街道的名称,从而解放驾驶员的双手,实现安全驾驶。

福特的语音识别系统

1. SYNC车载多媒体交互系统

福特的SYNC车载多媒体交互系统已经有7年的商业化历史。2007年1月,SYNC美国底特律国际车展发布,到2012年SYNC系统已经搭载在14款福特车型和5款林肯车型上。目前全球已有超过500万的汽车正在使用SYNC系统。SYNC已是汽车行业功能最完善和应用最广泛的汽车语音识别系统之一,其用户界面见图3。

SYNC使驾驶者和乘客可以在一个交互式汽车环境下获得便捷和安全的使用,用户只要通过语音就可以发出各种指令,进而获得各种超乎想像的简单控制感受,从而使用户最大限度地降低了传统驾驶过程中那种可能分神而引发危险性的人工控制模式。

SYNC的软件由福特与微软公司共同研发,目前福特已经购买了这个系统的专利权,用户可以终身免费使用。该系统支持语音拨打电话、手机蓝牙播放音乐、语音阅读短信及USB点歌等功能。

2. SYNC的语音识别能力

SYNC最初在北美上市时仅能识别三种语言。通过与美国Nuance公司合作,福特将SYNC可以识别的语言范围扩展到了20多种。面向中国市场推出的SYNC由福特联合微软、Nuance和泰为公司共同开发。

SYNC中文系统在标准中文的基础上,还能够识别各地方言的口音,包括上海、北京、四川、河北和江苏等地的普通话口音,比如北京口音的“儿”话音等。新福克斯可以快速通过语音控制功能,用中文来操作系统,例如拨打电话或者播放音乐。

SYNC目前可以识别1万多条指令,使客户能够更加随意地发布指令,而不会受到通常那种固定语言格式命令要求的限制。用户只需简单地说出他们的指令就可以开始导航,无论他们是在一句话中说出一个完整的地址,还是仅仅搜索兴趣点,SYNC都能够进行精确的解析。例如“帮我查找最近的意大利餐厅”,系统会生成目标搜索结果,而驾驶者只需说“带我去那里”便可直接导航到该目的地。语音调用音乐功能能够快速、便捷地识别各种不同的发音,用户不仅可以搜索音乐名称和艺术家、专辑或播放列表名称,也可以简单地说出他们感兴趣的音乐、体育或新闻节目类型,诸如“爵士乐频道”或“大都会歌剧院电台”,就能选择相应的节目和频道。扩展至SIRIUS旅游链接信息门户的语音命令。借助该功能,用户只需简单的说“我想知道煤气费”或“告诉我NFL分数”,就能获悉诸如体育比赛比分、天气情况、交通状态、燃料价格或电影列表等最新的信息和娱乐内容。

SYNC系统的语音识别控制功能主要分为基本命令(Basic Commands)、打电话(Phone)、调节空调(Climate)、娱乐(Entainment)、导航(Navigation)和SYNC车联网服务(SYNC Service)六大类,其系统构架见图4。

新一代SYNC AppLink系统的语音控制功能更先进,能够让移动应用程序开发者直接调用汽车音响系统的功能,借助手机端或云端语音识别软件处理指令。用户通过SYNC语音命令来控制汽车,而AppLink则是用来连接汽车和智能手机,只要智能手机上的应用支持AppLink,就可以出现在汽车界面上,用户可通过语音进行控制。无论是谷歌安卓、苹果iOS或其它智能手机系统的用户都可以下载和使用QQ音乐。

在驾驶车辆时,只需简单的语音命令即可进行操作,例如当驾驶者说出“播放本地歌曲”,SYNC系统的语音识别功能就自动为驾驶员播放存在手机里的音乐。相应地,当使用者发出“播放我喜欢”或“随便听听”等命令时,该系统也将自动执行所对应的功能。

2014年1月7日,在美国拉斯维加斯举办的消费电子展览会(CES 2014)上,福特汽车携手中国用户量第三大的互联网公司搜狗,借助搜狗语音助手功能,展示了AppLink2.0的最新功能。搭载福特SYNC AppLink的搜狗语音助手,能够通过车载语音控制设备开启和操控应用中的功能,大幅度提升驾驶体验。用户将搜狗语音助手与福特汽车相连后,可通过方向盘上的语音按钮向搜狗语音助手发出语音命令,比操作手机更加快捷和安全。同时可通车载音响设备及显示屏实现语音拨打电话、发短信、来信播报和快捷回复、查天气及聊天解闷。这也是未来智能汽车的发展趋势。

搜狗语音助手已接入搜狗自主研发的语音识别系统。经过一年多的持续测试和改进,该识别系统准确率已大幅度提升,通过结合福特SYNC AppLink系统先进的车内噪声处理技术,能够在车载环境下将语音识别准确率再次提升,从而大幅度提升汽车用户的使用体验。

新的进展

2014年是车载语音识别技术发生重大进展的一年。1月,谷歌在美国国际消费性电子展览会上,宣布与通用、本田、奥迪和现代共同成立“开放汽车联盟(OOA,Open Automotive Alliance)”,旨在将其开源系统Android应用于汽车领域。3月,苹果公司在日内瓦车展上公布了智能车载系统CarPlay,可以与法拉利、奔驰和沃尔沃的汽车实现联接。紧接着,苹果iOS 7操作系统的更新版iOS 7.1发布,它可以支持链接CarPlay系统。预计搭载谷歌OOA和苹果CarPlay的汽车即将上市。

两大国际IT巨头的战略决策表明,在智能手机上广泛应用的语音识别技术很快会在汽车上普及。它带来的第一个很大的变化是,驾驶员可以使用Google Now和Siri等成熟的语音识别工具,在驾驶过程中实现双手不离开转向盘就可以接听拨打电话、选择收音机频道、播放音乐和调节空调等操作。

结论

目前在中国汽车市场上搭载语音识别系统的车型逐渐增多,典型的系统包括福特汽车的SYNC车载多媒体交互系统、通用别克汽车的Intellilink智能车载交互系统、雷克萨斯汽车的Remote Touch 信息操作系统、上海汽车荣威车联网inkaNet系统中搭载的语音云驾驶iVoka等。新的更加智能的技术也正在不断涌现并推向市场,应用于更多的品牌和车款。

随着技术的进步,预计未来5年内,语音识别功能将会成为在中国市场上10万元左右的乘用车的标准配置。这是提高驾驶安全的有力武器。

语音识别技术在汽车上的应用相关推荐

  1. 【百度贾磊】汉语语音识别技术重大突破:LSTM+CTC详解(22PPT)

    1新智元原创1 作者:王嘉俊 新智元福利 回复1028下载贾磊22页PPT Google 去年发布了一项研究报告,说在美国年龄介于13到18岁的青年当中,约有55%的人每天使用语音搜索. 语音搜索正在 ...

  2. 关于在呼叫中心业务中应用语音识别技术的探讨

    关于在呼叫中心业务中应用语音识别技术的探讨 摘要:本文首先给出了语音技术的应用现状,接着对语音识别技术在呼叫中心中可应用可尝试的业务进行探讨,最后提出呼叫中心业务中应用语音识别技术的虚拟CSR概念. ...

  3. 人工智能之语音识别技术(二)

    1. 语音识别技术的重要性 各种终端设备的智能化和集成化程度越来越高,传统的信息检索和菜单操作方式已经越来越无法满足需求.迫切需要一种更加便捷的信息检索和命令方式来替代传统的按键操作. 语音识别技术的 ...

  4. 商业银行智能语音识别技术-笔记

    商业银行智能语音识别技术 原文链接 一.语音识别技术概述 基础概念 自动语音识别ASR 语音到文本STT 精准识别和翻译语音信息 1.语音识别技术发展 基于深度神经网络模型进行建模 2.语音识别的分类 ...

  5. 车内语音识别技术,让汽车活起来

    随着CarPlay.Android Auto以及Echo Auto等平台渗透乘用车市场,车内语音识别技术预期将成为主流:但仍有一个答案未知的问题是:市场上有任何语音启动技术已经准备好随机应对车内的关键 ...

  6. 汽车穿梭餐厅的语音识别技术及数据

    去年,Bluedot公司曾做过一项调查并发现:相比疫情初期,汽车穿梭餐厅(Drive-Thru/ 免下车服务餐厅)的访问量增加了36%.其实,免下车技术已经为人们服务了50多年.如今,人工智能(AI) ...

  7. 智能语音识别技术入门系列(上)

    本系列文章开始,我们将一起探索自动语音识别.语言处理技术所包含的核心算法.模型及未来的发展趋势.本篇文章我们主要讨论语音识别的基本概念.并理解语音识别技术的流程. (一) 自动语音识别技术ASR 自动 ...

  8. lms自适应滤波器实现噪声干扰的语音恢复_ZLG深度解析语音识别技术

    语音识别已成为人与机器通过自然语言交互重要方式之一,本文将从语音识别的原理以及语音识别算法的角度出发为大家介绍语音识别的方案及详细设计过程. 语言作为人类的一种基本交流方式,在数千年历史中得到持续传承 ...

  9. 科学网—语音识别技术发展史

    语音识别技术发展史 与机器进行语音交流,让它听明白你在说什么.语音识别技术将人类这一曾经的梦想变成了现实.语音识别就好比"机器的听觉系统",该技术让机器通过识别和理解,把语音信号转 ...

最新文章

  1. 初五迎财神!即使没有年终奖,也要来一发红包!
  2. flask img标签图片中src链接添加变量问题(好坑啊,不过终于成功了!!)
  3. java中如何关闭文件,在Java中捕获IOException后如何关闭文件?
  4. 10个一行代码就能搞定的编程技巧
  5. xml特殊符号的书写
  6. shell写入文件,后面会覆盖前面
  7. 感觉自己没有美术天赋,要不要放弃成为艺术生?
  8. 计算机保研英语,计算机专业保研面试英语自我介绍
  9. 四种引用类型:强、软、弱、虚
  10. 学习ARM的一些基本知识,个人整理
  11. Android之断点续传下载(转)
  12. 软考 2015年下半年卷 错题知识点记录
  13. 前20位Googler今安在?
  14. 【Web技术】1477- Tauri:下一代桌面应用开发框架?
  15. POJ 3026 Borg Maze(BFS+最小生成树)
  16. 暑假假期训练总结-3
  17. Python专辑-QQ机器人2:智能聊天、定时执行任务实现
  18. mysql分区为什么提高性能_通过分区(Partition)提升MySQL性能
  19. fiddler超全使用教程
  20. PaddlePaddle深度学习实战——英法文翻译机

热门文章

  1. Apache mod_rewrite
  2. JAVA责任链设计模式
  3. 慎用javascript:void(0) 【转】
  4. 《认清C++语言》---接口继承和实现继承
  5. HDU2010 水仙花数【进制】
  6. Bailian4120 硬币【0-1背包】
  7. Bailian4109 公共朋友-Common Friends【关系】
  8. Bailian3756 多边形内角和【数学计算】
  9. CCF NOI1031 等腰三角形
  10. POJ NOI MATH-7649 我家的门牌号