语音识别热词_出门问问 TWS 耳机语音交互解决方案
随着芯片、算法商在技术及应用方面的演进,尤其是连接、降噪方向的重大突破,越来越多的手机及耳机厂商推出了自家功能丰富、交互舒适的 TWS 耳机。
近日,出门问问新品发布会上推出的 TicPods 2 系列产品,在人机交互和语音助理方面,展现出了不少创新的交互及技术亮点:采用了多种手势的触控、头部控制、及语音唤醒和快捷口令;手表 + 手机的交互组合,将 4G 独立通讯的智能手表和耳机联动,在脱离手机终端的独立场景中,实现通讯、音频内容点播、翻译对讲、生活查询等一系列智能应用;结合场景做精细打磨,整合了更丰富的云端内容和服务,结合「小问秘书」、「小问翻译对讲机」、「小问电话助手」等智能应用,使产品的可玩性大大提高。
这也个传统耳机厂商及 TWS 耳机厂商,开拓了更广阔的视野。
出门问问 TWS 耳机解决方案是一套高集成度可定制化的 TWS 耳机语音交互解决方案,为便于查阅,以下将称 “出门问问 TWS 耳机语音交互解决方案” 为 “方案”。
方案整体架构
支持平台:高通 QCC5100 系列、ARM M4
方案核心技术及算法
回声消除(AEC)
在听音乐和 TTS 语音播报的时候识别唤醒词和命令词是一个必不可少的功能,这个时候回声就是一个需要解决的问题。而就回声消除而言,则需要从结构和算法两个方面来考虑。
算法支持:需优先考虑声学结构方面的优化以减少回声的强度,在此基础之上可以透过出门问问回声消除算法,进一步降低回声的影响。
双麦波束成形(Beamforming)
利用两个麦克风采集到的语音的相位差做处理实现定向拾音,增强耳机佩戴人的语音并且抑制环境干扰和噪音,可以实现即使在噪杂的环境下也能实现很高的唤醒识别率。
算法支持:建议两个麦克风上下排列,麦克风的连线指向嘴巴,两个麦克风的间距在 25mm 到 30mm 之间为最优。
降噪(Noise Suppression)
双麦的波束成形算法已经具备了一定的环境噪音的抑制,在此基础之上降噪算法可以进一步地抑制环境噪音。
算法支持:结合波束成形和降噪算法,我们可以提供 20dB 以上的综合降噪水平。
唤醒词和命令词识别(Wakeup Word & Command Words Detection)
在语音交互中为了降低系统的功耗以及减少无效识别,一般都有一个定制的唤醒词(如苹果的 “Hey Siri”)。当系统检测到唤醒词之后,才进入语音识别和交互的过程。除了唤醒词之外,还有一些常用的与音乐播放、接听电话、音量控制等相关的命令。这些命令因 为比较常用,理想情况下用户可以直接说命令词而无需先说唤醒词。
算法支持:目前出门问问的算法可以支 持以下中英文快捷命令词,并可以为客户提供定制化需求开发。
方案集成及定制功能
可与产品厂商在提供 TWS 耳机核心算法及技术的基础上共同参与硬件结构设计,可提供:
- 根据硬件设备定制唤醒词、命令词以及手机二次唤醒验证、声纹识别方案,提供数据录制;
- 通过优化声学结构减少计算开销和功耗,以及相应优化功能;(对于典型的双麦降噪 + 热词唤醒的场景下,算法的内存占用只有 70KB,包括唤醒词模型和所有计算需要的内存。)
方案开放程度
- 耳机端的语音交互核心算法:开放支持
- 耳机和手机通过蓝牙互联互动的私有协议:开放支持
- 手机端的唤醒词命令词的二步验证:开放支持
- 手机端的嵌入式语音识别、语音合成系统:开放支持
- 云端的语音识别、语义理解、对话管理、语音合成,以及第三方的内容和服务集成:开放支持
- 声学结构设计和芯片选型方面联合开发:开放支持
- 用户体验及相关体验设计:开放支持
方案性能指标测试
主要针对语音交互核心算法进行测试:
方案优势
- 算法性能上的优势;
- 资源占用上的优势;
- 完整的技术解决方案,尤其在系统集成和优化上具有优势;
方案落地案例
- 出门问问 TicPods 2 真无线耳机
- vivo TWS Earphone 语音交互方案
语音识别热词_出门问问 TWS 耳机语音交互解决方案相关推荐
- java热词_生成热词
根据CVPR论文生成热点词汇云图 用怕python 爬取论文到数据库中: 分析.查找关键词,对他排序: 生成热词汇云图: 一.python爬取数据 import requests import pym ...
- 绿联怎么样_绿联TWS耳机怎么样?
绿联TWS耳机是最近绿联发布的重磅新品--真无线耳机.作为知名数码配件厂商,进军耳机界,也并不意外,市场总会随着时间产生变化和淘汰. 那么绿联TWS耳机怎么样呢?下面我们进入正题. 开箱篇我想大概就不 ...
- java 热词_一个热词推荐的简单实现
为什么想做这个东西 一直好奇像亚马逊这类网站的搜索是如何做到推荐的,最近刚好看到一篇文章:Redis 与搜索热词推荐,然而只写了思路.所以,就是想自己实现一个. 先上个效果图,再聊: P.S. 按四年 ...
- 手机桌面百度搜索框不显示热词_【知乎热点话题】为什么很多人电脑桌面上软件图标寥寥无几甚至空空荡荡?请问怎么做到的?...
方法很简单:腾讯桌面整理+Windows10开始磁铁+任务栏透明(TranslucentTB) (桌面效果展示) (开始菜单中的磁铁效果展示) (文件夹打开效果展示) 总述:个人文件全部放入文件格子中 ...
- 手机桌面百度搜索框不显示热词_高效搜索神器,你选listary还是火柴?
本文预计阅读5分钟. 你的电脑桌面是否杂乱不堪呢? 是不是打开特定的文件,每次都要一级一级的打开目录呢? 试想这样一个场景,你需要找一个文件,你只记得它的名字,但你不记得它在什么位置了,这时你该怎么办 ...
- 手机桌面百度搜索框不显示热词_移动端搜索和PC端搜索的区别
随着智能手机的普及,移动端搜索量是越来越大了,在去年从未有人通过移动搜索我的博客,而到了今年,从通过统计工具的数据分析来看,已经有越来越多的用户通过手机搜索到我的博客. 有一段时间移动搜索来路很大的时 ...
- 出门问问发布无线智能耳机,李志飞:语音交互的下一个爆点
李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI AI公司出门问问又出了新品类产品. 这次是一款可触控无线智能耳机--小问智能耳机TicPods Free. 出门问问创始人及CEO李志飞, ...
- 思必驰刚折戟上交所,出门问问冲刺港交所能成功么?
数据智能产业创新服务媒体 --聚焦数智 · 改变商业 2023年5月30日,AI独角兽公司出门问问(Mobvoi Inc.)向港交所递交招股书,拟在香港主板挂牌上市,中金公司和招银国际为联席保荐人. ...
- 从创业公司到AI巨头 出门问问如何定义下一代人机交互?
https://www.toutiao.com/a6710470147057910286/ 在近期刚刚结束的世界移动通信大会(MWC19上海)期间,人工智能公司出门问问联合芯片巨头高通展示了其全系列T ...
最新文章
- 【python】使用python脚本将LFW数据中1672组同一个人多张照片拷贝出来
- Franzis CutOut 9 Professional中文版
- pat 甲级 1072. Gas Station (30)
- element弹框的的this.$alert、this.$prompt方法用法
- java onchange_jsp中select的onchange事件用法实例
- java判断线段是否相交函数_计算几何-判断线段是否相交
- Python 直接赋值、浅拷贝和深度拷贝全解析
- 【MYSQL笔记】MYSQL监视器
- 【目标识别】SIFT算法理论部分
- 排查MySQL同步延迟思路
- 三色交替的下拉列表框
- 使用visualSVN做版本管理
- java中的时间戳sssss,Java日期时间API系列35-----Jdk8中java.time包中的新的日期时间API类应用,微秒和纳秒等更精确的时间格式化和解析。...
- 通过maven安装spire.pdf
- cad命令栏怎么调出来_Solidworks工具栏,功能区不见了,怎么调出来?
- OpenWrt 把SD卡挂载到 /overlay
- MYSQL数据库高级SQL语句详解
- bat文件的@echo off是什么作用?
- 电信天翼物联网平台对接应用服务ctWing
- 微信机器人控制linux,关于微信公共平台聊天机器人控制开启和关闭的代码
热门文章
- 探索比特币源码5-私钥
- eclipse mat 打开dump文件,明明大小1G,打开后却只有不到100M.其他的去哪了
- AI应用开发实战系列之三:手写识别应用入门
- 两千块钱带来的 quot;希望quot;
- linux 切换root账号_Linux 服务器的安全保障,看看这些
- ios 静态库合成_iOS : 静态库(.framework)合并
- 中怎样载入选区_PS----关于选区的选取
- Java程序员的自我修养?
- 一个男的和计算机对话,父与子的对话:计算机算法
- 天大c语言离线考核答案,【天大考核】2019年秋学期考试《公共关系学》离线作业考核试题答案100分...