[机器学习入门] 李宏毅机器学习笔记-29 (Sequence Labeling Problem part 1;结构化预测-序列标记 part 1)
[机器学习入门] 李宏毅机器学习笔记-29(Sequence Labeling Problem part 1;结构化预测-序列标记 part 1)
VIDEO |
---|
Sequence Labeling
Example Task
POS tagging
词性标注,必须要考虑整个句子的information,所以光靠查表是无法解决的。
Outline
Hidden Markov Model (HMM)
隐马尔科夫模型
人是用一下两个步骤产生句子的。
HMM 2 steps
数字表示词相接的几率
比如动词后面接冠词,冠词后面接名词
产生某一词的几率就是一路上相乘的结果
HMM就是在描述说出某一句话的几率
总结一下
HMM – Estimating the probabilities
那么这个路径里的几率该如何得到呢?这就需收集data了。
有了充沛的标注数据集,这个问题就容易解决了。计算方法就是,比如,s后面接t的次数/s出现的个数=s后面接t的概率
HMM – How to do POS Tagging?
回到我们的任务是,有了句子x,找y,而y是未知的。
通过上面得到的几率,我们要把y找出来。
自然而然会想到是,概率最大的就是y,通过穷举y就可以实现。
HMM – Viterbi Algorithm
维特比算法
我们会发现,穷举的思想虽然容易想到,但是计算数量级会很大,还好我们有维特比算法来降低计算量。
HMM-Summary
HMM-Drawbacks
但是HMM有个问题,会脑补没有出现过的句子,很可能在training data中没有出现过的搭配却表现地不错,这种特点说明它在数据很少的时候是比较适用的。
那么为什么会产生这种脑补的现象,因为对他来说,transition probability和deviation 的probability是independent。
那么CRF就能解决这一问题。
(下接part 2 )
[机器学习入门] 李宏毅机器学习笔记-29 (Sequence Labeling Problem part 1;结构化预测-序列标记 part 1)相关推荐
- 《基于张量网络的机器学习入门》学习笔记7
<基于张量网络的机器学习入门>学习笔记7 量子算法 什么是量子算法 三个经典量子算法 Grover算法 背景 基本原理 例题 量子算法 什么是量子算法 例如我们求解一个问题,一个111千克 ...
- 《基于张量网络的机器学习入门》学习笔记6
<基于张量网络的机器学习入门>学习笔记6 密度算符(密度矩阵) 具体到坐标表象 在纯态上 在混合态上 纯态下的密度算符 混合态下的密度算符 密度算符的性质 量子力学性质的密度算符描述 第一 ...
- 《基于张量网络的机器学习入门》学习笔记5
<基于张量网络的机器学习入门>学习笔记5 量子概率体系 事件 互斥事件 概率与测量 不相容属性对 相容属性对 量子概率与经典概率的区别 量子测量 量子概率体系 我们将经典的实数概率扩展到复 ...
- 《基于张量网络的机器学习入门》学习笔记4
<基于张量网络的机器学习入门>学习笔记4 量子概率 将概率复数化 分布与向量的表示 事件与Hilbert空间 不兼容属性及其复数概率表示 为什么一定要复数概率 量子概率 将概率复数化 在经 ...
- 《基于张量网络的机器学习入门》学习笔记8(Shor算法)
<基于张量网络的机器学习入门>学习笔记8 Shor算法 来源 Shor算法的大致流程 因数分解 周期求取与量子傅里叶变换(QFT) Shor算法 来源 1994 1994 1994年,应用 ...
- python3中多项式创建_机器学习入门之机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合...
本文主要向大家介绍了机器学习入门之机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助. 分享 ...
- l2正则化python_机器学习入门之机器学习之路: python线性回归 过拟合 L1与L2正则化...
本文主要向大家介绍了机器学习入门之机器学习之路: python线性回归 过拟合 L1与L2正则化,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助. 正则化: 提高模型在未知数据上的 ...
- A.机器学习入门算法[七]:基于英雄联盟数据集的LightGBM的分类预测
[机器学习入门与实践]入门必看系列,含数据挖掘项目实战:数据融合.特征优化.特征降维.探索性分析等,实战带你掌握机器学习数据挖掘 专栏详细介绍:[机器学习入门与实践]合集入门必看系列,含数据挖掘项目实 ...
- matlab 职坐标,机器学习入门之机器学习实战ByMatlab(四)二分K-means算法
本文主要向大家介绍了机器学习入门之机器学习实战ByMatlab(四)二分K-means算法,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助.前面我们在是实现K-means算法的时候,提到 ...
- 机器学习入门 01 —— 机器学习概述
文章目录 系列文章 机器学习概述 1.1.人工智能概述 1 人工智能应用场景 2 人工智能小案例 3 人工智能发展必备三要素 4 人工智能.机器学习和深度学习 5 小结 1.2.人工智能发展历程 1. ...
最新文章
- mysql data ibdata1_database - 如何在MySQL中收缩/清除ibdata1文件
- 李航「机器学习」最全综述
- 是你的数据还不够强!谷歌大脑「数据增强」开源,大神QuocLe出品
- 谈谈考研复试的一些经验和建议
- 《Spark大数据分析:核心概念、技术及实践》一3.5 API
- php 判断点在多边形内,PHP判断点是否在多边形区域内外
- VC++6.0安装步骤
- Jmeter 获取、读取token 供其他 HTTP 请求调用
- Kibana插件sentinl实现邮件报警
- vue查询列表中所有用户信息_vue实现全匹配搜索列表内容
- 使用URLDecoder对URL进行中文解析
- vue 接口请求下载文件
- excel两列数据对比找不同_Excel快速核对数据,不用函数这招让你3秒搞定,建议收藏...
- TCC(TinyC)编译器汉化(中文编译器、汉语编程)之四:语法分析上
- 3分钟了解今日头条推荐算法原理
- picpick截图工具截取滚动窗口只滚动一次就结束了解决办法
- ubuntu安装mysql安装包_ubuntu安装mysql
- Windows下python程序报错Nomodule named 'gevent'解决及ERROR: xxx.whl is not a supported wheel on this platform
- Educational Codeforces Round 89 (Rated for Div. 2) D. Two Divisors(数论)
- pwm频率输出不对解决思路
热门文章
- 论文笔记 Acquiring Common Sense Spatial Knowledge through Implicit Spatial Templates (AAAI2018)
- 开发公链需要多少钱 开发公链区块链的搭建费用
- 统计学cv值是什么意思_什么是CV值
- 【黑金原创教程】【Modelsim】【第五章】仿真就是人生
- 008 使用MyBatis,easyUI实现CRUD操作样例-CUD(CRUD完毕)
- 关于Raster的理解
- 灰色关联分析法详细步骤解释
- Optional使用示例
- Django项目(五):注册模块—登录注册
- 在 Cocos Creator 中使用缓动系统(cc.tween)