2019独角兽企业重金招聘Python工程师标准>>>

前言:

如今的科技在各个方面的发展都非常的迅速,越来越多“不切实际”的幻想也在被实现!而作为现代人信息获取以及沟通需求最为方便快捷的路径-智能语音,这条路就摆在我们面前。

演讲嘉宾:
盛京,阿里云达摩院-机器智能技术专家

达摩院语音组成立于2014年,具有语音识别、语音合成、声纹识别、自然语言处理、语音交互等等的能力。

以下内容根据演讲嘉宾视频分享以及PPT整理而成。

本次主要内容分为四部分:
一.公共云方案
二.智能语音本地化部署方案
三.智能互动大屏
四.语音自学习平台

一、公共云方案

在公共云方面,服务于集团34个BU,107个业务,包括手淘、支付宝、菜鸟、钉钉、口碑、高德、UC、优酷土豆、天猫精灵等;除了内部外,还有映客直播、一号互联等用户。

从2014年手淘上线后,我们的语音识别覆盖了各种各样的场景。这里面有单纯的手机APP,也有车载,包括18年的时候,包括地铁通过语音购票、甚至最新款的汽车。

给大家具体介绍下,服务于客服方面,我们是如何利用智能语音能力的?

在智能客户领域,我们两个最典型的的案例就是支付宝95188和菜鸟的1518。
支付宝是一个呼入的场景,他是一个电话的、智能的客服。大家如果有打过支付宝电话的一定知道,打完之后,电话另一方会说“请用一句话来描述您的问题”。这时候您可以说:“我的密码忘了”,这时候会有机器人和你对话,告诉你具体的方法。这个就是支付宝电话客服的应用场景。

那么呼出场景,就是菜鸟的智能语音助手,去年双11的时候,我本人就接到过菜鸟打来的电话,他会说:先生,您的某某快递放在小区的蜂站了。如果您说可以,他会礼貌的挂机;如果您说不可以的,他会问你:先生,您什么时候在家,我会把快递给您送过去等等。

这两个应用都节省了大量的人力,在双11时,支付宝智能客服自主率达到了97%;菜鸟机器人替200W快递员打电话。在过去11快递员工作主要就是打电话,现在通过菜鸟助手,就能解决绝大多数问题。

二、智能语音本地化部署方案

除了刚刚介绍的公共云的情况,我们在本地化部署上也有很多应用的场景。
我们提供的主要是一套软件,有能力的开发公司可以把我们语音的能力集成到你们的产品中,这样我们可以共同深入打造各行各业各个场景下的解决方案。
我们提供的能力包括 语音识别、语音合成、MRCP、防串音、最重要的还有语音自学习平台。

我们最主要的是聚焦于语音的核心能力,紧靠行业伙伴,我们是一起打造产品的。
我们和友商的区别主要是:友商做语音产品都是端对端的,所有东西都是自己做;而我们只做最核心的,语音识别或者语音合成。然后把能力开放出来,让合作伙伴基于这样的能力来做各种各样的应用。

我们本地化部署方案的标杆是有:智慧法院的一个解决方案,目前我们深度合作了法院领域头部的ISV,包括了华宇、云嘉等等。

我们标杆案例有浙江高院、福建高院等等,覆盖了300家法院,有超过1万家法庭应用了我们语音识别。

这是我们在法院的一些场景,所做的一些事情。同时全国的几大互联网法院,包括第一家杭州互联网法院,北京、广州互联网法院,用的都是我们的语音识别。

在智能客服领域,我们联合阿里小蜜,和ISV为中国移动、中国平安做了智能电话机器人、外呼以及金牌话术。

金牌话术还是要再提一下,在客服领域,不同人的交流沟通能力也不一样的,反馈到结果上就是有的人业绩比较好,有的人差一些。我们金牌话术要做的就是:基于客服和客户的聊天,来把沟通弄技巧挖掘出来。每当你和客户交流的时候,就会提示你应该怎么说,应该做什么样的引导。

三、智能互动大屏

除了刚才介绍的客服和司法,我们还有达摩院全球首创多模态语音交互方案,能够实现在强噪音环境下的免唤醒人机交互。
比如说在公共空间,地铁购票、肯德基点餐,都能够通过我们这套解决方案实现人机交互,我们这个产品的优势,就是强噪音语音环境下的语音识别、同时免唤醒、以及长句子的流失理解。
这套语音交互产品模式就是:我们提供软硬件一体的套件,再加上定制的外壳,我们有一个官方标准的,合作伙伴也可以根据各种需求来定制,之后我们就可以对接到客户的系统里面。
这时候就能有各行各业的应用,比如对接客户的支付系统。图书管理系统、导航系统。

这套方案的标杆案例就是:上海地铁语音售票机。
• 2018年3月已正式落地上海南站和汉中路地铁站
• 全球第一台地铁语音售票机
• 在地铁真实嘈杂环境下语音识别准确率超过96%

上海地铁语音售票机介绍视频点击播放

四、语音自学习平台

最后我们来介绍下—语音自学习平台
之所以提供语音自学习平台,是因为我们在与客户接触中,听到客户很多对语音识别的建议。首先语音识别是一个非标输出的软件,部署到客户现场的时候,可能由于麦克风、口音等等,导致识别率不好;或者领域不匹配,比如客户有一些专业的用语,我们自己的模型可能覆盖不到。

所以我我们提供了语音自学习平台。独特优势主要在于:可以通过自助来添加语料的方式来进行优化,可以输入词、句子、篇章,具备分钟级的训练速度,而且操作很简单,可以一键式完成。
语音自学习平台主要包括三部分:

泛热词
北京女子图片→北京女子图鉴

类热词(人名、地名等)
原告以不应选公司→原告与布衣轩公司
我们可以看到,如果你不做任何的优化,很容易出现各种混淆错误。

定制化语言模型
提供的是整个的篇章,比如说有些公司有内部的材料,比如说客服行业,我们可能有一些产品介绍、文档之类的,都是长篇的文本,我们就可以定制化语言模型来优化。

以上就是我们今天讲的主要内容,大家如果有兴趣可以持续关注我们!

下面是我们的QA环节:

1. 语音产品收费
公有云都是支持免费试用的,按照文档一步步操作,就可以创建自己的语音识别程序。
点击试用
2. 我们语音有哪些类型?
a) 实时语音识别:实时反馈结果
b) 一句话识别:应用在搜索的场景下
c) 录音文件转写:相较于实时语音识别,速度很快

3.教育行业有哪些语音场景?
在过去,我们无法落实每堂课的知识点,如果有了智能语音,我们可以把老师讲的内容全部转成文字,再通过一定的质检规则来判断老师是否做到位了;同时类似于儿童学英语行业,口语评测之类的也会有一些需求。

相关链接:

PPT地址:敬请期待
产品地址:https://ai.aliyun.com/nls
上海云栖大会主论坛孙权现场直播连线上海南站
点击观看语音点餐机介绍视频
点击观看真机演示视频

原文链接

转载于:https://my.oschina.net/u/1464083/blog/3025313

泡沫下的破浪者,智能语音产品到底落地何处?相关推荐

  1. 热度下的冷思考——智能眼镜到底有没有前途?

    来源:环球网 我们曾期望Google眼镜能够成为革命性的新产品,因为它某种程度上实现了大家对未来的幻想. 然而Google眼镜作为概念产品虽然有趣,但它仍然太不成熟,而且因为存在侵犯隐私的可能还被大众 ...

  2. 智能合约到底是什么?

    智能合约到底是什么? 智能合约的约束力 重复验证的瓶颈 智能合约的另外一种形态 智能合约未来的两种路线 对司法体系的启示 总结 相关链接 区块链的『智能合约』是一个容易引起争议的概念,一次 Vital ...

  3. 拆 米家台灯_小猪拆测—MIJIA 米家 LED智能台灯到底怎么样?

    小猪拆测-MIJIA 米家 LED智能台灯到底怎么样? 2018-05-11 20:40:43 74点赞 84收藏 32评论 本篇内容来自#全民分享季#第三季活动,本周选题#分享你的生活记录#,共同瓜 ...

  4. 智能体到底是什么?这里有一篇详细解读

    来源:机器人圈 概要:根据我们希望实现的目标以及衡量其成功的标准,我们可以采用多种方法来创建人工智能. 根据我们希望实现的目标以及衡量其成功的标准,我们可以采用多种方法来创建人工智能.它涵盖的范围极其 ...

  5. 今晚直播 | 微软亚洲研究院徐毅恒:预训练时代下的文档智能

    「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和 ...

  6. 智能工厂到底是什么?

    智能工厂到底是什么? 智能工厂.智慧工厂大家都在提及,但是究竟指的是什么,没有人能够真正的说明白,但是目前各个集团型企业申报关于工厂改造提升的时候基本上也都不怎么提及智能工厂,现在大部分提出的都是灯塔 ...

  7. ROS下配置镭神智能c16雷达信息

    ROS下配置镭神智能c16雷达信息 用户配置写入协议(UCWP) 介绍 3.0 头部 3.1 电机 代码详情 3.2 以太网 3.3 时间 用户配置写入协议(UCWP) 介绍 用户配置写入协议:Use ...

  8. ROS下打开镭神智能c16雷达以及驱动的理解

    ROS下打开镭神智能c16雷达以及驱动的理解 镭神c16驱动代码流程详解 1.主函数流程 2.初始化驱动driver 3.循环使用UDP获取报文 4.所有成员函数截图 代码详情 代码链接 镭神c16驱 ...

  9. 智汀智能家居到底有什么魔力,引来如此多的入局者?

    近年来,智能家居势头如火如荼,智能电视.智能窗帘.智能门锁......纷纷入局到家庭中,使得整个行业逐渐迈入全屋智能化时代.然而,在这智能化大潮之下,智能家居到底有什么魔力,引来如此多的入局者呢? 你 ...

  10. 当下互联网环境下物理主机和云主机到底哪个好?

    当下互联网环境下物理主机和云主机到底哪个好? 很多人在选购服务器时会纠结到底是应该选择物理服务器还是虚拟服务器,一方面因为是对两者的概念较为混淆,不清楚其区别与各自优势,另一方面也是没明确好自己的需求 ...

最新文章

  1. Cause: java.sql.SQLException: ORA-00904: ID: 标识符无效
  2. Leaflet中使用leaflet.polylineDecorator插件绘制箭头线及虚线矩形
  3. Go如何按行读取文本
  4. MongoDB 聚合
  5. TensorFlow:实战Google深度学习框架(二)实现简单神经网络
  6. 织梦dedecms内核自适应移动POS机刷卡机招商加盟企业网站源码
  7. JS判断IE6/IE7/IE8系列的写法
  8. 怎样才能成为优秀的前端工程师
  9. 小鹏汽车提交赴美IPO:上半年营收1.42亿美元 何小鹏持股31.6%为最大股东
  10. JMH 性能测试框架
  11. 声明式智能推荐系统应用架构探索
  12. shell脚本连接、读写、操作mysql数据库实例
  13. 汇编语言中 编译 连接 构建时的一些错误以及错误的修正方法(不断积累中...)
  14. CMD 乱码怎样解决
  15. Iptables-外网地址及端口映射到内网地址及端口
  16. HDU 5857 Median(水~)
  17. BufferedImage 图片背景色黑色问题
  18. 成功解决python.exe无法找到程序入口 无法定位程序输入点
  19. CDN:BootCDN
  20. 半次元收藏夹爬虫(残疾版,不喜勿喷)

热门文章

  1. BAT-局域网内在线电脑IP
  2. 第一百一十二节,JavaScript浏览器检测
  3. 我的ES6学习之路(一)
  4. jquery分页插件精选
  5. 配置Windows Server 2008 允许多用户远程桌面连接
  6. .Net----Remoting 激活 激活方式
  7. 数据分析之分析美国人口
  8. Restful 风格
  9. Android------Button 添加声音效果(两种方式)
  10. Oracle ORA-01555(快照过旧)