车载智能语音已经成为了日常用车非常重要的高频功能之一,但当前绝大多数语音交互系统的使用感受,其实并不愉悦。

其中,大多数车载智能语音系统谈“听得清”、“听得懂”尚显得差强人意,更谈不上能够顺畅的自由“对话”和“互动”。

被诟病的较多的问题,主要在于:

一是需要一遍又一遍的唤醒系统,还往往需要等到语音系统完整复述完并且处理完上个指令后,驾驶员才能开口提其他需求,太考验人们的耐心;二是说出指令需要刻意记住关键词才能成功识别,太考验记忆力。

又或者是一个人开口,其他人都需要“闭嘴”,这是因为语音系统很容易受到其他语音干扰。如果一旦有“熊孩子”在一旁“捣乱”,往往会导致语音系统无法正常识别指令。

几天前,理想汽车正式发布了其智能语音系统“理想同学”2.2版本,重点针对上述痛点进行了改善。该公司相关负责人表示,新版本的核心目标是:服务“全家人”的“自由对话”。

一、“理想同学”2.2版本解决哪些痛点?

2.2版本的“理想同学”主要升级了四个方面的功能,包括连续对话、可见即可说、四音区锁定、跨音区上下文对话。

1、连续对话

理想同学2.2版本可以支持单次唤醒后的连续指令下达。在上一个指令成功执行后,智能语音系统有20秒的时间,来等待乘客发出下一个指令。

这样的好处就是,用户在需要连续操作时,不再需要一遍一遍的重复“理想同学”来再次唤醒系统。

除了以上,连续对话功能还有一个特点在于支持随时插话,而不需要耐心静待系统完成上一条指令之后再开口,系统会自动录入指令队列,然后按照顺序执行。

比如,你可以连续下达“空调调到20度”、“打开音乐”,“打开后排座椅通风”等等多个指令而无需间歇等待,让语音功能操作变得便捷而高效。

除了这些,理想同学令人印象深刻的还有一点在于“无效文本拒识”功能。在智能语音开启过程中,即便有其他人插话和交谈,理想同学能够“聪明”地识别到哪些是需要执行的指令,哪些是车内的交谈内容。

2、可见即可说

用户在使用理想同学控制某个APP时,乘客不用再刻意记住指令、关键词这类触发语,只要看到屏幕上所显示的菜单栏写着什么就说什么,系统可以自动识别并执行。

当然,这需要理想的智能语音系统与外部应用APP深度绑定和开发,目前首批支持的应用包括QQ音乐、喜马拉雅、蓝牙电话、车辆中心。

值得一提的是,考虑到安全因素,车辆中心里有关驾驶的设定并不支持非主驾区域的语音控制,也就是说这部分内容只能由驾驶员控制。

3、四音区锁定

在理想ONE已经实现了全车多音区均能进行智能语音对话外,理想同学2.2版本对全车多音区应用再次做了精细化的体验升级:支持除主驾之外任意一个音区的识别关闭。

作为一辆家庭用车尤其家有多个小朋友,往往会出现对语音控制的“话语权”争抢,尤其是有些“熊孩子”的故意捣乱,往往会影响家长的正常使用。

这个时候,主驾驶只要说“关闭后音区”、“不要听副驾驶”等指令,就可以关闭相应位置的语音识别,避免熊孩子捣乱。

4、跨音区上下文对话

当前,智能语音被诟病死板的场景之一在于同一个功能指令下的重复啰嗦,更在于不同驾驶位的人员明明是类似的需求,不仅需要主驾多次唤醒语音助手,还需要针对不同座位来重复同样的指令,来完成不同区域的调整。

而理想同学2.2针对这些场景有了升级,可以针对上条指令内容进行上下文关联对话,并对其他座位上的乘客需求进行调整。

比如,针对空调、座椅、车窗等调整,第一次如果不满意,就可以再次说再大点/冷点,温度调到XX度,风量调到XX档等;

主驾调好后,可以说“副驾也是”等一键同步到其他座椅位置;并且在相同的指令语境下,其他座椅位置的乘客,也可以唤醒理想同学后,说“我也要”。

发布会结束后,我们对理想同学2.2版本进行了体验。整体感受来看,理想同学的四音区应答能力非常好,连续对话、可见可说,以及跨音区的上下文对话能力都已经能做到,已经优于市面上大多数语音交互的体验,相信OTA升级后的理想同学将成为理想ONE的核心卖点之一。

二、自研能力是关键优势之一

本次智能语音系统“理想同学”2.2版本只是理想汽车2021年OTA升级计划的一部分。按照计划,这套智能语音系统在今年将陆续启动FOTA2.1、FOTA2.2、FOTA2.3三个阶段的产品升级。

随着2021款理想ONE上市,FOTA2.1正式推出,搭载了自研的理想同学引擎,底层能力替换为地平线 + 思必驰 + 微软,增加四音区锁定和唤醒打断功能,并可实现语音控制动力模式、驾驶模式;

如今FOTA2.2版本的升级也主要是早期规划部分,包括自由对话、连续对话、想说就说、无效文本拒识、可见即可说&可想即可说、跨音乐上下文对话、 HIFI 级情感化语音合成。

官方显示,OTA2.2版本更新将于9月15日前陆续开启推送。

接下来的FOTA2.3升级则包括四音区副驾屏语音系统、可见即可说 II 期、多应用控制及仲裁策略、视频应用接入、全车媒体应用接入。

在此之前,理想ONE采用的是第三方供应商提供的智能语音系统,随着自研理想同学语音引擎上线,底层能力也被替换,理想智能语音功能不仅体现出极大地个性化,针对当前语音交互的痛点来实现优化升级。

这背后,是车企对深度自研的需求与能力体现。

对车企来说,只有 “深度自研”才能拥有不受制于供应商的开放能力和主导权,有了更大的发挥空间,来更加灵活实现属于品牌自身特色的差异化与个性化,并能快速拓展引入功能和场景细化,实现跨垂类生态和语音控制场景全链条的逐步打通。

在供应商提供底层技术和基础框架的基础上,其他的大部分,如交互架构搭建、操作系统、上层的功能开发和应用等将由主机厂自我研发实现。当前来看,几家头部新势力企业都倾向于自研模式。

在本次发布会上,理想汽车还推出了基于车载应用生态的应用中心,对于接入的应用,理想汽车制定了一定的标准和要求。

首先,理想汽车和第三方公司共同定制专属理想汽车的车载App,接入的应用统一实现符合理想车机系统风格的UI设计。其次,接入的应用要与理想车机系统做深度融合,比如需要全方面支持语音控制,需要符合理想汽车的交互逻辑。

这样第三方应用可以更好地适配理想ONE的显示屏以及车机系统,界面效果、系统流畅性、使用感受都会大幅提升。目前这类第三方的应用程序增加到了9个。

理想汽车与其他新势力的显著区别有两点,一是走增程路线,另外是只卖一款车,一个配置,一种价格。

一直以来,理想汽车强调的都是用户体验,更舒适、更愉悦的空间, 而智能座舱、智能语音等均是理想汽车主打的核心技能之一。

2021款理想ONE标配全栈自研的理想AD高级辅助驾驶系统,在原有的 Level 2级别辅助驾驶基础上,升级NOA导航辅助驾驶的能力。

该系统计划在9月份升级,配合高精地图的覆盖,新增导航辅助驾驶、虚实线识别、锥筒识别、限速识别。在第四季度新增车辆朝向识别、停止线识别、斑马线识别、地面标识识别、城市路口增强、信号灯提醒、离车泊入、一键泊出。

此前,理想汽车设定的销量目标是单月突破一万台。5月25日新款(2021款) 理想ONE上市后,6-8月都保持了连续高增长的态势。

数据显示,8月份理想ONE交付量已经达到9433辆,同比增幅高达248%。目前来看,距离目标仅一步之遥。

重新定义车载语音交互:服务“全家人”的“自由对话”相关推荐

  1. 同行者语音助手车载版_从软件许可到按需服务,车载语音交互的“连通性”革命GGAI头条...

    加入高工智能汽车专业行业群(自动驾驶5群,车联网智能座舱3群,智能网联商用车2群),加微信:17157613659,出示名片,仅限智能网联汽车软硬件供应商及OEM厂商. 在过去的20年时间里,车载语音 ...

  2. 车载语音交互「停摆」

    作为汽车智能化的小众赛道,车载语音交互系统曾经是车企争相上马的智能化配置.一方面,由于不涉及功能安全,同时又可以增加车主的操作便捷性,语音交互在前几年受到市场热捧.另一方面,系统的成本快速下降,车型的 ...

  3. 阿里云智能语音交互服务导览

    阿里云智能语音交互 产品介绍 & 接口文档 阿里云iDST的智能语音交互服务主要有以下几个大类: 语音识别服务ASR :将语音转换成文字的能力快速集成,打造出"能听"的应用 ...

  4. 使用react-native-audio进行华为云语音交互服务(实时语音转写)大致流程

    基础前端框架:react-native 语音交互服务:华为云 1.react-native-audio录制音频 华为云支持的音频编码格式如下表: 一共有六种,但是一般用下表的前两种,即不压缩的裸音频格 ...

  5. 使用Google Voice打造车载语音交互

    /   今日科技快讯   / 近日,谷歌在博客文章中宣布,该公司计划在公共环境中再次测试增强现实(AR)眼镜原型.有些原型将看起来像普通眼镜,但将配备麦克风.摄像头以及透明显示屏.这些眼镜还没有被列为 ...

  6. 硬核干货,老曹解密“语音交互”背后的黑科技!

    点击▲关注 "中生代技术"   给公众号标星置顶 更多精彩技术内容 第一时间直达 第 6 期出席<大咖来了>直播栏目的嘉宾是百度 DuerOS 首席布道师曹洪伟,进行了 ...

  7. 从全栈式解决方案到情感化,揭秘问众智能切入车载语音市场的最佳姿势...

    *问众智能CEO张亚 如果说语音交互是车载场景的最佳方式,未来谁掌握车内语音交互"话语权",谁就将主宰车辆智能网联的新时代. 经过多年的渐进式发展,语音交互的价值正逐步走出单纯&q ...

  8. 行业洞察 | 你的车载语音助手足够Smart吗?

    截止2021年,中国乘用车智能语音交互功能的搭载率已经高达86%.目前,汽车座舱正朝着智能化趋势发展,而车载语音助手是智能驾驶舱中最核心的功能.在驾驶过程中,由于驾驶员的手和眼睛都被任务所占据,因此车 ...

  9. 同行者语音助手_车载语音搭载率接近八成,“后价格战”时代的错位竞争GGAI头条...

    加入高工智能汽车行业群(自动驾驶5群,车联网智能座舱3群,智能商用车群),加微信:17157613659,并出示名片,仅限汽车零部件及OEM厂商. 全球车载座舱交互领域又将迎来一轮新的变革.尽管汽车自 ...

最新文章

  1. 【linux】Valgrind工具集详解(六):使用Valgrind gdbserver和GDB调试程序
  2. tpmc tps oracle,TPS(每秒处理事务数)和TPMC(每分钟处理交易量)
  3. 使用SSH反向隧道进行内网穿透
  4. 趣学python3(25)-del,deepcopy以及内存引用计数
  5. ASP.NET MVC3 中的AJAX
  6. 大楼通信综合布线系统_什么是网络综合布线系统组成?网络综合布线系统如何选择线缆?...
  7. 编程范式之栈的抽象操作
  8. thinking in java(第七章)
  9. PHP泡泡龙源码,泡泡龙 游戏源码
  10. Hexo博客优化之Next主题美化
  11. 贪吃蛇游戏设计(一)————游戏策划
  12. 2022年华数杯数学建模
  13. tomcat普通用户启动不了
  14. 宏晶STC单片机使用STC-ISP串口烧录失败的原因与解决方法汇总
  15. 计算机找不到网络链接,找不到宽带连接的解决办法-电脑故障
  16. 网站死链检查处理方法
  17. edge打开pdf不显示印章_一旦碰到Edge浏览器打不开pdf文件,只需这样做就可完美解决!...
  18. Flink-DataStream执行环境和数据读取
  19. word转换为html代码,如何将Word转换为网页html格式的方法(附代码清理方法)
  20. 【t101】小明搬家

热门文章

  1. 区块链能保护隐私?别被忽悠了
  2. Android自定义Dialog+圆角处理
  3. 国内移动旅行类APP评测与盈利情况
  4. 在 VMware 14 中安装 win10 虚拟机
  5. Process类介绍
  6. 叮当叮当的优势在那里
  7. 用border-image实现QQ气泡聊天窗效果
  8. 地理信息系统(GIS)系列——Dojo 基础
  9. 特斯联科技携手比特大陆共建国内首家物联网区块链实验室
  10. 解决绿联扩展坞插网线无法联网的问题