随着语音助理的技能越来越多样化,要处理的任务也越来越复杂,Amazon为了能让Alexa在更短的时间内,处理并完成复杂的任务,AmazonAlexa AI团队近日在美国AI协会举办的第33届研讨会中,发表了一篇关于压缩神经网络的论文,透过压缩词向量表的新方法,在尽可能不影响准确度的情况下,将神经网络缩小90%,使Alexa在处理复杂的任务时,也能在毫秒内给予正确的回应,也让Alexa能够持续扩展新技能。语音助理Alexa目前支持超过70,000种第三方的技能,每个月以数个技能在增加,因此,压缩神经网络是必要的方法,来使这些技能的自然语言理解模型,更有效地储存,在自然语言理解应用中,大多数的神经网络的大小都是来自于巨大的查询表(lookup table),该查询表会用词向量(word embedding),记录输入文字的相互关联性,词向量通常是一个包含300个数的庞大序列,来抓取字词意义的信息,而神经网络被应用于许多AI系统中,但是其一特性就是规模非常大,也意味着执行速度缓慢,对于像是Alexa这种需要实时处理口语请求并给予回复的语音助理系统,是个很大的问题。
AWS想到办法让Alexa能在毫秒内做出回复
在Amazon研究团队的实验中,Amazon利用一套预先训练的词向量Glove,Glove与其他热门的词向量一样,用大量的训练数据与词语进行比对,在一个300维度空间中,以一个点表示该词语,相似的词会被归类在同一群中,通常自然语言理解系统会利用这种预先训练的词向量,因为可以产生跨概念的相关词汇,举例来说,能够让语音助理透过关联性,理解较为少见的指令。过去自然语言理解研究员都会用包含10万个词的庞大查询表,将词向量表的300维度缩减为30,并用较小的词向量作为自然语言理解系统的输入数据,Amazon研究团队则是将词向量表整合至神经网络,如此一来,就能够用特定任务的训练数据,来优化词向量。为了降低词向量的维度,Amazon采用奇异值分解(singular-value decomposition),在较高维度的空间产生较低维度的投影,该方法类似于在三维空间中针对物体产生二维投影,在其中一项实验中,Amazon研究团队开发的系统能够将神经网络缩小90%,同时网络模型的准确度只有减少不到1%,在相同的压缩率之下,过去研究最佳的结果是准确度约下降3.5%。部分信息参考:http://www.cafes.org.tw/info.asp

转载于:https://blog.51cto.com/13220658/2343417

AWS想到办法让Alexa能在毫秒内做出回复相关推荐

  1. 微虚拟机服务器,亚马逊AWS发布开源虚拟化技术,可125毫秒内启动微虚拟机!

    原标题:亚马逊AWS发布开源虚拟化技术,可125毫秒内启动微虚拟机! 在AWS Lambda发布4年后,每月为数十万活跃客户处理数万亿次执行,作为当下最热的无服务器计算技术,AWS没有停下探索的步伐. ...

  2. k8s aws 部署_如何在短短30分钟内使用CircleCI设置到AWS S3的持续部署

    k8s aws 部署 by Adam Watt 通过亚当·瓦特 如何在短短30分钟内使用CircleCI设置到AWS S3的持续部署 (How to setup Continuous Deployme ...

  3. web flash rtmp_基于RTMP和WebRTC开发大规模低延迟(1000毫秒内)直播系统

    问题 随着移动设备大规模的普及以及流量的资费越来越便宜, 超低延迟的场景越来越多. 从去年到今年火过的场景就有在线娃娃机, 直播答题, 在线K歌等. 但要做到音视频的超低延迟确是很不容易, 编码延迟, ...

  4. Barcode Reader在45毫秒内实现条码识别

    应我的客户要求,需要找到一款可以在极短时间识别二维条码的软件以应对他们现在极其迅速的货品入库需求.正好听说过一款Dynamsoft Barcode Reader的开发包,根据其官网介绍最新版对条码检测 ...

  5. Redis 进阶笔记

    文章目录 第一部分 Redis 快速实战 第一节 缓存原理与设计 1.1 缓存基本思想 1.11 缓存的使用场景 1.12 什么是缓存? 1.13 大型网站中缓存的使用 1.2 常见缓存的分类 1.2 ...

  6. 第五阶段-第五阶段高性能分布式缓存Redis

    第五阶段 大型分布式系统缓存架构进阶 文章目录 第五阶段 大型分布式系统缓存架构进阶 第一部分 Redis 快速实战 第一节 缓存原理与设计 1.1 缓存基本思想 1.11 缓存的使用场景 1.12 ...

  7. 【一周头条盘点】中国软件网(2018.12.24~2018.12.28)

    每一个企业级应用的人都置顶了中国软件网 中国软件网为你带来最新鲜的行业干货 一周热点 网信办:金融信息服务提供者不得散布虚假金融信息 近日,国家网信办发布金融信息服务管理规定,规定明确,金融信息服务提 ...

  8. 2019IDC:是谁拿下中国机器学习平台市场份额第一?

    原创:谭婧 2019年8月27日,国际数据公司IDC发布了国内首份<IDCMarketScape™:中国机器学习开发平台市场评估>,透过报告,可以看到机器学习平台赛道已经聚集了三支实力军团 ...

  9. 大型Java多用户商城系统设计开发的心得和困难

    2019独角兽企业重金招聘Python工程师标准>>> 看到别的朋友在ITEYE上发表的"开发电子商务网站技术选型"有感而发.地址是 [url]http://ww ...

最新文章

  1. Android之打造可定制的全场秒杀倒计时控件
  2. 字符串-判断数字的三个方法
  3. 对SqlServer2008中的日志进行截断的方法
  4. Leangoo到底好在哪里?
  5. 2019.7.17刷题统计
  6. Spark芝加哥犯罪数据分析与可视化
  7. WCF 进阶: 对称加密传输
  8. linux ruby作用域,浅谈ruby语言中的一些概念(lambda, proc, block)
  9. 最强android平板,最强安卓平板!华为MatePad Pro来了:搭载麒麟990
  10. Pandas DataFrame索引和列属性
  11. Terms of Service - Screen Capture
  12. Deepin下安装日文输入法
  13. c语言程序小时工资计算,C语言入门之工资计算
  14. 读hdfs上的文件时出现Unable to write to output stream问题的解决方案
  15. 2013年第四届蓝桥杯Java程序设计本科B组决赛 农场阳光(编程大题)
  16. 日照分析的计算机精度,日照分析的部分参数详解
  17. 绝对经典!百句浓缩版小常识(ZT)
  18. python玩转我的世界_PYTHON玩转我的世界——批量生成铁傀儡
  19. html制作国字布局,各种经典布局--“国”字布局
  20. 日本药妆店扫货必备手册·收藏版

热门文章

  1. Chrome V8引擎系列随笔 (1):Math.Random()函数概览
  2. PLSQL_PLSQL读和写XML文件方式(案例)
  3. 桌面虚拟化之本地模式(离线模式)大比拼
  4. Read Excel
  5. 一天变成36小时[转]
  6. 吐槽Javascript系列三:数组的陷阱
  7. 短视频抢了直播饭碗,花椒、映客们逆袭抖音、快手无门
  8. EVE-NG之Cisco FirePower 系统
  9. Bazel C++ 基础[翻译]
  10. iOS 9.0 设置状态栏颜色 和隐藏