深度学习核心技术精讲100篇(二十七)-如何利用NLP技术对ASR的query文本进行预处理纠错?
前言
语音系统中语音内容识别 ( ASR ) 的精准性,是影响智能语音产品发展的关键制约因素,用户query的文本,通常是由ASR系统将用户的语音命令转换而成,但由于技术上的原因,这些由ASR生成的文本可能包含错误,继而导致后续的用户意图理解出现偏差。如何利用NLP技术对ASR的query文本进行预处理纠错成了一个亟待解决的问题。
01 ASR纠错问题的介绍
1. 语音交互流程
在分享语音纠错的相关问题之前,先简单介绍一下小爱同学语音使用流程:首先我们需要唤醒小爱同学,比如,手机按键或者语音唤醒,唤醒之后进入录音模块,启动录音前开启Voice Activity Detection ( VAD ) 状态,检测当前有没说话声音,如果没有则忽略,如果有,会把语音记录下来传递到下一个模块,就是最受关注的Automatic Speech Recognition ( ASR ),该模块负责把语音转译成文字。
文本理解模块Natural Language Understanding ( NLU ),主要目的是试图理解ASR转换出的文本,准确识别用户的意图,然后给出
深度学习核心技术精讲100篇(二十七)-如何利用NLP技术对ASR的query文本进行预处理纠错?相关推荐
- 深度学习核心技术精讲100篇(八十一)-NLP预训练模型ERNIE实战应用案例
前言 基于飞桨开源的持续学习的语义理解框架ERNIE 2.0,及基于此框架的ERNIE 2.0预训练模型,在共计16个中英文任务上超越了BERT和XLNet, 取得了SOTA效果.本文带你进一步深入了 ...
- 深度学习核心技术精讲100篇(十七)-多标准中文分词( Multi-Criteria-CWS)
前言 论文:https://arxiv.org/pdf/1712.02856.pdf : 代码和语料:https://github.com/hankcs/multi-criteria-cws . 本 ...
- 深度学习核心技术精讲100篇(二十)-如何通过树模型实现梯度提升树(GBDT)+LR,随机森林(RandomForest) +LR
前言 在讲如何通过树模型做特征工程之前,首先让我们回顾一下一个机器学习(除去深度学习项目部分)项目的大致流程: 从业务场景中抽象出问题--分类问题,回归问题,还是聚类问题等, 接下来是数据获取,数据清 ...
- 深度学习核心技术精讲100篇(二十四)-简单谈下深度学习在中文分词中的应用
前言 随着深度学习的普及,有越来越多的研究应用新模型到中文分词上,让人直呼"手快有,手慢无".不过这些神经网络方法的真实水平如何?具体数值多少?以Sighan05中的PKU数据集为 ...
- 深度学习核心技术精讲100篇(五)-通过CTR预估对比深度学习模型(deepfm)梯度提升模型(catboost)
前言 CTR预估模型的特点: 毫无疑问这个任务的是个二分类任务,预测点击与否. CTR 预估的特征一般是 用户的日志特征和画像特征,包含类别特征和数值型特征两种. 此任务的评估指标是 AUC 得分 或 ...
- 深度学习核心技术精讲100篇(六)-keras 实战系列之知识蒸馏(Knowledge Distilling)
前言 深度学习在这两年的发展可谓是突飞猛进,为了提升模型性能,模型的参数量变得越来越多,模型自身也变得越来越大.在图像领域中基于Resnet的卷积神经网络模型,不断延伸着网络深度.而在自然语言处理领域 ...
- 深度学习核心技术精讲100篇(五十八)- 如何量化医学图像分割中的置信度?
前言 在过去的十年里,深度学习在一系列的应用中取得了巨大的成功.然而,为了验证和可解释性,我们不仅需要模型做出的预测,还需要知道它在做出预测时的置信度.这对于让医学影像学的临床医生接受它是非常重要的. ...
- 深度学习核心技术精讲100篇(五十五)- 基于OpenCV实现棋盘图像识别
本文我们将一起学习如何使用计算机视觉技术识别棋子及其在棋盘上的位置 我们利用计算机视觉技术和卷积神经网络(CNN)为这个项目创建分类算法,并确定棋子在棋盘上的位置.最终的应用程序会保存整个图像并可视化 ...
- 深度学习核心技术精讲100篇(三十五)-美团餐饮娱乐知识图谱——美团大脑揭秘
前言 " I'm sorry. I can't do that, Dave." 这是经典科幻电影<2001: A Space Odyssey>里HAL 9000机器人说 ...
最新文章
- SSM高级整合项目实战
- Python 学习笔记(2)创建文件夹
- PDF:解决从PDF中复制文字时出现的空方框问题
- java B2B2C源码电子商务平台 -SpringCloud配置中心高可用搭建
- laravel数据库相关操作
- 我的专业博客启动了!
- 指数级暴增、复杂场景下,揭秘百度云原生湖仓架构等系列数据产品
- 4-2 ADO.NET-查询和检索数据13
- 音乐搜索器 多站合一_分享一堆可以免费听音乐的良心网站!赶紧码住哦
- LeetCode每日一题:存在重复元素(No.217)
- 高级着色语言HLSL入门(4)
- Docker使用CA认证
- 机器人焊枪动作与编程实验_工业机器人编程实验.doc
- P3237 [HNOI2014]米特运输
- 关于脚踝不得不说的各种事
- 2021年电赛E题解析数字模拟信号混合传输收发机(详细介绍)
- 数据库 not in 的坑
- 数据结构笔记之跳表(SkipList)
- 安卓系统能运行 linux,重磅!安卓系统竟能运行PC软件,实测效果令人惊在当场!...
- H3C网络设备配置命令大全(持续更新)
热门文章
- Android中Activity之间的数据传递(Intent和Bundle)
- 企业运维之域控篇(九)--辅助域强制占用后的操作--清除数据
- [转][Timer学习]wall time和monotonic time
- Oracle查询表结构的一些相关语句
- 上海奋斗记--从3500到700W(转)
- [原创]微软拼音输入法2007(含64位版)
- 记一次WiFi芯片W600上串口只能回显的问题
- CSP认证201809-4	再卖菜[C++题解]:差分约束、前缀和
- PAT甲级1012 The Best Rank :[C++题解]4个成绩取排名最低:排序、二分(好题)
- 服务器json文件怎么创建对象,JavaScript中对JSON对象的基本操作示例