原标题:从语音识别到语义识别还有多少路要走?

随着人工智能近年定义和产业分工越发精细,语音识别渐渐分成了语音识别和语义识别两个支系。语音和语义虽然只有一字之差,但却是天壤之别。

打个简单的比方,语音识别相当于人的耳朵,而语义识别则是大脑,语音识别帮助机器获取和输出信息,而语义识别则是对这些信息进行加工。

语音发展史

语音是最自然的交流方式,自从1877年爱迪生发明了留声机,人们就开始了与机器的交流,但主要的还是与人的交流,而非机器本身。

1950年,计算机科学之父阿兰·图灵在《Mind》杂志上发表了题为《计算的机器和智能》的论文,首次提出了机器智能的概念

20世纪80年代,语音识别技术能够将口语转化为文本。

2001年,计算机语音识别达到了80%的准确度。

语音识别产品的应用

语音识别作为打造良好交互体验的重要前提,今年的发展可谓是持续火爆。在智能音箱市场,令人首先想到的就是Amazon的Echo。Echo作为将自然语音转化为在线指令的设备,其效率之高毋庸置疑,并且可保持在线的自然环境中的自然语言识别。

而国内语音识别领域也开始争夺大战。以科大讯飞听见系列产品为例,自2015年发布以来,总用户突破1000万,应用于30余个行业。目前,已经形成了以听见智能会议系统、讯(询)问笔录系统、听见转写网站、录音宝APP、听见智能会议服务等以智能语音转写技术为核心的产品和服务体系。

晓芯电话机器人就是基于语音识别技术的一种应用产品。晓芯智能以服务低端劳力密集型企业为宗旨,帮助企业突破人工客服效率低、工作时间长的瓶颈,从而帮助企业扩大规模和提升业绩。

我们所期望的语音识别实质上是人机交互,大致上可以理解为人与机器之间无障碍沟通。在通信侧音源质量限制的情况下,晓芯机器人在对音源质量通过算法进行智能降噪以及通信侧持续优化之后,仍然能以80%的识别率达到行业领先的水准。但即便是达到100%也还是没有实现真正的人机交互。

而我们晓芯电话机器人有很多的客户都问我们能不能达到语义识别?

目前来说确实不能,要从语音识别成功转变成真正意义上的语义识别,在智能电话客服的技术实现上依旧存在难点,大量的多音字和同音词是干扰机器人识别精准度的的主要障碍。首先要获得大量的数据,用这些数据不断训练,来提高识别的准确率。这一步的跨越还存在多种难关要攻克。就目前的市场分析来看,语义识别只是慢慢渗透到我们的生活中,还没有成熟的在行业中应用自如。随着技术不断地成熟,晓芯智能也必定会将语义识别技术融合进晓芯电话机器人。

届时,我们将会再一次改变人工客服职业,电销行业乃至更多传统企业。

语义识别的三个层次

1、应用层:包括行业应用和智能语音交互系统

2、NLP技术层:包括以语言学、计算机语言等学科为背景的,对自然语言进行词语解析、信息抽取、时间因果、情绪判断等等技术处理,最终达到让计算机“懂”人类的语言的自然语言认知,以及吧计算机数据转化为自然语言的生成。

3、底层数据层:词典、数据集、语料库、知识图谱,以及外部世界常识性知识等都是予以是被算法木星的基础。

语义识别的应用场景

语义识别技术可以分析网页、文件、邮件、音频、论坛、社交媒体中的大亮数据,应用领域广泛,既可以直接应用与医疗、教育、金融等行业。也可以通过技术接口应用于所有智能语音交互场景,如智能家居、车载语音、可穿戴设备、VR、机器人等,从交互的方式上,也可以分为:事实问答、知识检索、分类问题等。智能语音交互被看做未来人工智能技术中最值得期待的应用场景。

人工智能作为国家战略发展规划之一,足见其重要性。在这个政策的驱动下,各种资源包括国家型自然科学基金、产业基金、地方政府财税优惠政策、人工智能相关实验室、科技产业园区等切实促进人工智能的发展落地,为自动驾驶、计算机视觉、语音/语义识别创业提供了更好的条件和基础设施。

(学术性分析来源于网上)

关zhu:晓芯电话机器人返回搜狐,查看更多

责任编辑:

从语音识别到语义识别还有多少路要走?相关推荐

  1. 从语音识别到语义识别,中间还有多长的路要走?-模拟/电源-与非网

    最近科技圈刮起一股收购风,前面博通收购高通还在如火如荼的进行,这周苹果就宣布收购音乐识别软件 Shazam.Shazam 这个软件,通过手机麦克风收录音频片段,能够识别音乐.电影.电视节目甚至是广告. ...

  2. 语音识别与语义识别究竟有何区别?

    原标题:语音识别与语义识别究竟有何区别? 语音识别与语义识别有何区别呢?举个更通俗的例子来说明"语音识别"与"语义分析"在人工智能技术层次上的不同:用户对着电视 ...

  3. 一种基于语音识别的机器人语义识别系统的制作方法

    本发明涉及机器人语义识别,尤其涉及一种基于语音识别的机器人语义识别系统. 背景技术: 目前,很多家庭都拥有机器人,但是很多时候机器人并不能准确识别用户对其发出的指示,使用户操作机器人不方便,这样的机器 ...

  4. 语音识别,语义理解一站式解决之智能照相机(人脸识别,olami)

    转载请注明CSDN博文地址:http://blog.csdn.net/ls0609/article/details/76546716 olami sdk实现了把录音或者文字转化为用户可以理解的json ...

  5. 漫话中文自动分词和语义识别:中文分词算法

    原文链接: http://www.matrix67.com/blog/archives/4212 漫话中文自动分词和语义识别(下):句法结构和语义结构 | Matrix67: The Aha Mome ...

  6. AI 识别抑郁症正确率高达八成,但AI+精神健康还有很长的路要走

    来源: 智能相对论(aixdlun) 近年来,"抑郁症"一词越来越多的被人们提起,不少名人如白岩松.崔永元等都曾表示陷入过抑郁症的痛苦,而抑郁症患者不堪病痛而自杀的新闻也屡见不鲜. ...

  7. 本地语音识别_语音 识别_语音识别 - 云+社区 - 腾讯云

    广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 录音文件识别请求,数据结构,android sdk,ios sdk,自学习模型,使 ...

  8. AI识别抑郁症正确率高达八成,但AI+精神健康还有很长的路要走

    请点击此处输入图片描述 文|颜璇 来源|智能相对论(aixdlun) 近年来,"抑郁症"一词越来越多的被人们提起,不少名人如白岩松.崔永元等都曾表示陷入过抑郁症的痛苦,而抑郁症患者 ...

  9. 基于Python+百度语音的智能语音ChatGPT聊天机器人(机器学习+深度学习+语义识别)含全部工程源码 适合个人二次开发

    目录 前言 总体设计 系统整体结构图 系统流程图 运行环境 Python 环境 Pycharm 环境 ChatterBot 环境 模块实现 1. 模型构建 2. 服务器端 3. 客户端 4. 语音录入 ...

最新文章

  1. python参数传递方法_深入理解python中函数传递参数是值传递还是引用传递
  2. 语音识别基础,总有一天你会用到
  3. python xlrd文件
  4. 【linux】Linux配置环境变量
  5. [文章备份]RSS阅读器在手机上APP配置方法
  6. hadoop jar包_Hadoop学习之路(5)Mapreduce程序完成wordcount
  7. Linux命令应用大词典-第 15章 文件、目录权限和属性
  8. dubbo之rmi协议使用
  9. Error:Cannot find bean: org.apache.struts.taglib.html.BEAN in any scope
  10. 吴恩达深度学习——机器学习策略(二)
  11. 轻松提高Win2003的运行速度
  12. 本地怎么传文件到服务器,本地传输文件到服务器
  13. 自适应滤波器(Adaptive Filter)
  14. 财务数据人一定要懂的分析方法——杜邦分析法
  15. 【cpu温度过高的原因】
  16. 推荐几个值得关注的微信公众号
  17. 扩展无线网络(WDS桥接功能)
  18. 如何批量在图片上加统一的文字?
  19. 网络探测和诊断工具 - mtr
  20. 浅谈Python语言之quote()使用

热门文章

  1. vim 基础命令大全
  2. python3—列表
  3. 如何对react进行性能优化
  4. nodejs的req取参req.body,req.params,req.query
  5. javascript第四弹——变量、作用域、内存
  6. for循环删除集合陷阱
  7. 6天通吃树结构—— 第一天 二叉查找树
  8. foundation 数组NSArray学习
  9. [原]最大流, 最小分割分析
  10. Asp.net(C#)利用File Field多文件上传