机器学习(二十三)——Beam Search, NLP机器翻译常用评价度量, 模型驱动 vs 数据驱动
https://antkillerfarm.github.io/
Beam Search
Beam Search(集束搜索)是一种启发式图搜索算法,通常用在图的解空间比较大的情况下,为了减少搜索所占用的空间和时间,在每一步深度扩展的时候,剪掉一些质量比较差的结点,保留下一些质量较高的结点。
这样减少了空间消耗,并提高了时间效率,但缺点就是有可能存在潜在的最佳方案被丢弃,因此Beam Search算法是不完全的,一般用于解空间较大的系统中。
上图是一个Beam Search的剪枝示意图。
Beam Search主要用于机器翻译、语音识别等系统。这类系统虽然从理论来说,也就是个多分类系统,然而由于分类数等于词汇数,简单的套用softmax之类的多分类方案,明显是计算量过于巨大了。
PS:中文验证码识别估计也可以采用该技术。
参见:
http://people.csail.mit.edu/srush/optbeam.pdf
Optimal Beam Search for Machine Translation
http://www.cnblogs.com/xxey/p/4277181.html
Beam Search(集束搜索/束搜索)
http://blog.csdn.net/girlhpp/article/details/19400731
束搜索算法(Andrew Jungwirth 初稿)BEAM Search
NLP机器翻译常用评价度量
机器翻译的评价指标主要有:BLEU、NIST、Rouge、METEOR等。
参考:
http://blog.csdn.net/joshuaxx316/article/details/58696552
BLEU,ROUGE,METEOR,ROUGE-浅述自然语言处理机器翻译常用评价度量
http://blog.csdn.net/guolindonggld/article/details/56966200
机器翻译评价指标之BLEU
http://blog.csdn.net/han_xiaoyang/article/details/10118517
机器翻译评估标准介绍和计算方法
http://blog.csdn.net/lcj369387335/article/details/69845385
自动文档摘要评价方法—Edmundson和ROUGE
https://mp.weixin.qq.com/s/XiZ6Uc5cHZjczn-qoupQnA
对话系统评价方法综述
模型驱动 vs 数据驱动
最近阅读了这篇文章,深有感慨:
https://mp.weixin.qq.com/s/N7DE0kvf8THhJQwroHj4vA
成不了AI高手?因为你根本不懂数据!听听这位老教授多年心血练就的最实用统计学
注:吴喜之教授是我国著名的统计学家,退休前在中国人民大学统计学院任统计学教授。吴教授上世纪六十年代就读于北京大学数学力学系,八十年代出国深造,在美国北卡罗来纳大学获得统计学博士学位,是改革开放之后第一批留美并获得统计学博士学位的中国学者。多年来吴教授在国内外数十所高校讲授统计学课程,在国内统计学界享有盛誉。其知名的学生有李舰和刘思喆。
李舰,从2003年开始,一直把R当作随身武器奋战在统计学和数据分析的第一线,是Rweibo、Rwordseg、tmcn等高质量R包的作者,在业界积累了大量的经验,目前供职于Mango Solutions(中国),任数据总监。
刘思喆,2012至2016年就职于京东商城,推荐系统平台部高级经理,主要负责和推荐系统离线、在线相关的用户行为、商品特征的建模,以及数据监控平台。因工作业绩,在《京东技术解密》一书中获“数据达人”称号。
机器学习(二十三)——Beam Search, NLP机器翻译常用评价度量, 模型驱动 vs 数据驱动相关推荐
- NLP自然语言处理 集束搜索(beam search)和贪心搜索(greedy search)
https://blog.csdn.net/qq_16234613/article/details/83012046 https://blog.csdn.net/weixin_38937984/art ...
- NLP自然语言处理系列- week6-文本生成案例(5)(PGN+Beam Search)
NLP自然语言处理系列- week6-文本生成案例(5)(PGN+Beam Search) PGN 模型 Beam Search 在计算机科学中,Beam Search是一种启发式搜索算法,通过在有限 ...
- 【NLP】选择目标序列:贪心搜索和Beam search
构建seq2seq模型,并训练完成后,我们只要将源句子输入进训练好的模型,执行一次前向传播就能得到目标句子,但是值得注意的是: seq2seq模型的decoder部分实际上相当于一个语言模型,相比于R ...
- 【自然语言处理】【文本生成】Transformers中使用约束Beam Search指导文本生成
Transformers中使用约束Beam Search指导文本生成 原文地址:https://huggingface.co/blog/constrained-beam-search 相关博客 [自然 ...
- 文本生成任务之营销文本生成(Seq2seq+attention、Pointer Generator Network、Converage、Beam Search、优化技巧、文本增强)
文章目录 引言 项目任务简介 0. 数据预处理 0.1 将json文件转化成txt文件 0.2 词典处理 0.3 自定义数据集SampleDataset(Dataset类) 0.4 生成Dataloa ...
- 直播 | SemEval-2020自由文本关系抽取冠军方案解读(附NLP竞赛常用技巧总结)
「PW Live」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交 ...
- 集束搜索(Beam Search)
来源:Coursera吴恩达深度学习课程 我们来看看集束搜索(beam search)算法,上篇文章选择最可能的句子讲了对于机器翻译来说,给定输入(法语句子),我们并不想要一个随机的英语翻译结果,而是 ...
- 集束搜索的误差分析(Error analysis in beam search)
来源:Coursera吴恩达深度学习课程 回忆一下,在这五门课中的第三门课3-2 Coursera吴恩达<构建机器学习项目> 第二周课程笔记-机器学习策略(2)中,我们讲解了误差分析是如何 ...
- Beam Search集束搜索
在Seq2Seq解码部分中,常用到Beam Search.每个时刻它会保存b(beam size)个概率最大的选择作为当前的最佳选择,然后解码下一时刻时,继续选择和之前保存的b个选择组合起来后的概率最 ...
最新文章
- 使用TensorRT加速yolo3
- 【强化学习入门】马尔科夫决策过程
- 小一寸照片的尺寸规格 小一寸的照片多少像素
- 如何永久关闭WPS热点,WPSCENTER,WPSNOTIFY,WPS新闻,WPS广告,WPS弹窗.
- 推荐几个好用又好玩的vscode插件!
- 计算机显示网络无权限访问权限,[系统知识]电脑显示无internet访问权限怎么办...
- L1-087 机工士姆斯塔迪奥-PAT 团体程序设计天梯赛 GPLT
- 奇迹mu在服务器运行,奇迹mu 服务端的常用端口及功能
- springboot过滤器和拦截器使用
- Python数据处理基础操作
- 毕业了,异地恋只能分手吗?
- 2020面试要点大全
- 中山大学曾兆阳_实习派 | 曾兆阳: “宝藏男孩”的进阶之路
- 排序之路:快速排序和木桶排序
- 如何从高德获取地铁数据
- ftp常见错误代码记录下
- 弘辽科技:徒有贵族身份,却连一分钱都没有。
- 行车记录仪改家用监控求助
- 【刷题篇】避免洪水泛滥
- hdmi网线延长器_HDMI网线延长器有何优势
热门文章
- 数据访问层,完整的增,删,改,查
- js获取浏览器和屏幕宽高等信息(转)
- java语句梗_请大神给我解释一下下面这句JAVA语句的意思
- ES6公用立体轮播组件的封装及使用
- Some Essential JavaScript Questions And Answers(2)
- 相似图像识别检 —基于图像签名(LSH)
- [动态代理三部曲:上] - 动态代理是如何坑掉了我4500块钱
- PXC5.7(Percona XtraDB Cluster)+HAproxy集群部署
- Microsoft Operations Management Suite 启用NPM网络性能监视
- 通过七牛云建立私有图床