语音识别技术,也被称为自动语音识别AutomaTIc Speech RecogniTIon,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

语音识别系统提示客户在新的场合使用新的口令密码,这样使用者不需要记住固定的口令,系统也不会被录音欺骗。文本相关的声音识别方法可以分为动态时间伸缩或隐马尔可夫模型方法。文本无关声音识别已经被研究很长时间了,不一致环境造成的性能下降是应用中的一个很大的障碍。

其工作原理:

动态时间伸缩方法使用瞬间的、变动倒频。1963年Bogert et al出版了《回声的时序倒频分析》。通过交换字母顺序,他们用一个含义广泛的词汇定义了一个新的信号处理技术,倒频谱的计算通常使用快速傅立叶变换。

从1975年起,隐马尔可夫模型变得很流行。运用隐马尔可夫模型的方法,频谱特征的统计变差得以测量。文本无关语音识别方法的例子有平均频谱法、矢量量化法和多变量自回归法。

平均频谱法使用有利的倒频距离,语音频谱中的音位影响被平均频谱去除。使用矢量量化法,语者的一套短期训练的特征向量可以直接用来描绘语者的本质特征。但是,当训练向量的数量很大时,这种直接的描绘是不切实际的,因为存储和计算的量变得离奇的大。所以尝试用矢量量化法去寻找有效的方法来压缩训练数据。Montacie et al在倒频向量的时序中应用多变量自回归模式来确定语者特征,取得了很好的效果。

想骗过语音识别系统要有高质量的录音机,那不是很容易买到的。一般的录音机不能记录声音的完整频谱,录音系统的质量损失也必须是非常低的。对于大多数的语音识别系统,模仿的声音都不会成功。用语音识别来辨认身份是非常复杂的,所以语音识别系统会结合个人身份号码识别或芯片卡。

语音识别系统得益于廉价的硬件设备,大多数的计算机都有声卡和麦克风,也很容易使用。但语音识别还是有一些缺点的。语音随时间而变化,所以必须使用生物识别模板。语音也会由于伤风、嗓音沙哑、情绪压力或是青春期而变化。语音识别系统比指纹识别系统有着较高的误识率,因为人们的声音不像指纹那样独特和唯一。对快速傅立叶变换计算来说,系统需要协同处理器和比指纹系统更多的效能。目前语音识别系统不适合移动应用或以电池为电源的系统。

语音识别系统的应用领域

语音识别系统:

语音识别技术的应用可以分为两个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现,特别是近几年来迅速发展的语音信号处理专用芯片(ApplicaTIon Specific Integrated Circuit,ASIC)和语音识别片上系统(System on Chip,SOC)的出现。

语音识别系统的应用领域:

语音识别系统应用领域之:电话通信的语音拨号

特别是在中、高档移动电话上,现已普遍的具有语音拨号的功能。随着语音识别芯片的价格降低,普通电话上也将具备语音拨号的功能。

语音识别系统应用领域之:汽车的语音控制

由于在汽车的行驶过程中,驾驶员的手必须放在方向盘上,因此在汽车上拨打电话,需要使用具有语音拨号功能的免提电话通信方式。此外,对汽车的卫星导航定位系统(GPS)的操作,汽车空调、照明以及音响等设备的操作,同样也可以由语音来方便的控制。

语音识别系统应用领域之:工业控制及医疗领域

当操作人员的眼或手已经被占用的情况下,在增加控制操作时,最好的办法就是增加人与机器的语音交互界面。由语音对机器发出命令,机器用语音做出应答。

语音识别系统应用领域之:个人数字助理

个人数字助理(Personal Digital Assistant,PDA)的语音交互界面。PDA的体积很小,人机界面一直是其应用和技术的瓶颈之一。由于在PDA上使用键盘非常不便,因此,现多采用手写体识别的方法输入和查询信息。但是,这种方法仍然让用户感到很不方便。现在业界一致认为,PDA的最佳人机交互界面是以语音作为传输介质的交互方法,并且已有少量应用。随着语音识别技术的提高,可以预见,在不久的将来,语音将成为PDA主要的人机交互界面。

语音识别系统应用领域之:智能玩具

通过语音识别技术,我们可以与智能娃娃对话,可以用语音对玩具发出命令,让其完成一些简单的任务,甚至可以制造具有语音锁功能的电子看门狗。智能玩具有很大的市场潜力,而其关键在于降低语音芯片的价格。

语音识别系统应用领域之:家电遥控

用语音可以控制电视机、VCD、空调、电扇、窗帘的操作,而且一个遥控器就可以把家中的电器皆用语音控起来,这样,可以让令人头疼的各种电器的操作变得简单易行。

除了上文中所提到的应用以外,语音识别专用芯片在其他方面的应用可以说是不胜枚举。随着语音识别专用芯片的技术不断提高,将给人们带来极大的方便。

语音输入是计算机在哪个领域的应用,语音识别技术是什么_语音识别技术应用领域介绍...相关推荐

  1. 语音输入是计算机在哪个领域的应用,人工智能语音识别支持9种语言

    近日,搜狗输入法更新至10.8版本.据悉,新版本主要针对语音输入和多语言输入两大功能进行了创新升级. 9种外语语音识别,搜狗输入法成国内支持语种最多输入法 首先,新版搜狗输入法的较大亮点,就是上线了全 ...

  2. Qt通讯录(语音输入+发邮件+发短信+头像)

    Qt通讯录(语音输入+发邮件+发短信+头像) 项目背景 功能 运行程序 关键技术 语音识别ASR 发送电子邮件 AddressBook5.0 Gitee地址 项目背景 作为一个Qt小白,迫于大一下学期 ...

  3. 讯飞输入法PC版测评:拼音输入糟糕,语音输入强悍

    其实我手机用的就是讯飞输入法,它的语音输入和手写输入确实很爽. 最近有朋友在我的文章后面留言说,讯飞也有电脑版,于是去了讯飞主页下载安装试用了一回. 在太平洋下载站,关于讯飞输入法PC版的介绍是这样的 ...

  4. 计算机语音输入和存储,语音输入输出装置

    语音输入输出装置是指将人的语音信息直接输入或输出计算机的人机接口装置.人们在日常生活中大部分是通过语音来传递信息的,因此语音输入输出装置是人机接口装置的重要发展方向. 中文名 语音输入输出装置外文名 ...

  5. 用计算机输入文字语音播放出来,Win10如何实现电脑语音输入?Win10使用搜狗输入法语音输入文字的方法...

    http://www.xitongzhijia.net/xtjc/windows10/ 不知道大家知不知道,电脑是支持语音输入文字的,每当打字打累的时候,或者不想打字的时候,我们就可以进行电脑语音输入 ...

  6. 苹果语音输入最新资讯

    ​据 The Information 报道,微软招聘了此前于苹果负责 Siri 相关业务的 Bill Stasior 担任与 AI 相关的职位. 美国和欧洲多国监管机构正在对谷歌.苹果和亚马逊就涉嫌侵 ...

  7. 文字识别,语音输入全场景应用解析,让你的职场办公效率狂飙

    我们平常在办公的时候,进行文字录入是在所难免的,甚至有时候为了把一些文档做成电脑上的文字版,甚至在哪里拼命的打字输入,一弄就是几个小时,其实对于现在来说,对于大量的文字还使用键盘手打,已经是一种非常落 ...

  8. 十问亿级神经元类脑计算机:AI领域有望突破,哪些还需火候

    来源:澎湃新闻 近日,浙江大学联合之江实验室共同研制成功了中国首台基于自主知识产权类脑芯片的类脑计算机(Darwin Mouse). 研究团队在9月1日的成果发布会上指出,该类脑计算机在神经元规模上超 ...

  9. 讯飞输入法更新10.0版本 上线全新A.I.语音输入引擎

    原标题:讯飞输入法10.0最新版本隆重发布 更快更准更智能 迈入人工智能时代,A.I.赋能并不是简单的口号.近日,讯飞输入法更新至10.0版.据悉,上线全新的A.I.语音输入引擎,使通用语音识别率98 ...

  10. 东南大学计算机学院分数线,“东南大学”2019本一批次专业录取分数整理!计算机、建筑领域实力强,又是985、211、双一流名校!...

    原标题:"东南大学"2019本一批次专业录取分数整理!计算机.建筑领域实力强,又是985.211.双一流名校! 前言: 近期部分大学,开始陆续公布其2019年专业录取数据,为了更好 ...

最新文章

  1. c语言中void指针,C 语言 void指针
  2. ModuleNotFoundError: No module named ‘config‘
  3. oracle 中least,ORACLE 内置函数之GREATEST和LEAST
  4. html网页访问计数器,HTML添加网站计数器(Cookie)
  5. 根据 HTML 规范,以下代码中,外层容器 .outer 的宽高分别是:
  6. php 强制刷新,web端实现后退强制刷新功能代码
  7. SWPU第一届APP程序设计大赛筹备工作
  8. 使用sersync实现多台服务器实时同步文件
  9. 推荐系统:参数协同过滤
  10. VOS中历史话单显示通话会话超时中断详解
  11. NSTimer循环引用
  12. 声音均衡器怎么调好听_均衡器怎么调能达到最佳效果
  13. 自适应大邻域搜索算法
  14. python计算手机销量年增长率_「净资产增长率」Python量化数据获取:总资产同比增长率与净资产同比增长率 - seo实验室...
  15. 深圳现货原装正品JST提供各种专为汽车市场而设的线束连接器PAP-12V-S PAP-13V-S PAP-10V-S PHR-9 PHR-10
  16. outlook签名文件编辑_如何在Microsoft Outlook中创建,编辑和应用签名
  17. 关于鸿蒙,你怎么看,三面美团Android岗
  18. 拼多多怎么设置快捷回复
  19. 笔记本电脑C盘变红或变满,怎么处理?
  20. 华为项目管理的精髓干货!可收藏

热门文章

  1. golang--channal与select
  2. 手机布局rem的使用(rem)
  3. 认识数据驱动,数据驱动是怎么使用的
  4. 微信分享网页 图标不显示
  5. 熵(Entropy):机器学习
  6. 强大的 Stream 函数式编程
  7. Web3即将到来,我们做了什么?
  8. 影响ae渲染时间的计算机配置,分享两套影视后期电脑配置2019 能流畅使用ae和pr的电脑主机推荐...
  9. Google Safe Browsing API的使用
  10. 开发基于地图的火车站点查询系统