[机器学习入门] 李宏毅机器学习笔记-29(Sequence Labeling Problem part 1;结构化预测-序列标记 part 1)

PDF VIDEO

Sequence Labeling

Example Task

POS tagging

词性标注,必须要考虑整个句子的information,所以光靠查表是无法解决的。

Outline

Hidden Markov Model (HMM)

隐马尔科夫模型
人是用一下两个步骤产生句子的。

HMM 2 steps

数字表示词相接的几率
比如动词后面接冠词,冠词后面接名词

产生某一词的几率就是一路上相乘的结果

HMM就是在描述说出某一句话的几率

总结一下


HMM – Estimating the probabilities

那么这个路径里的几率该如何得到呢?这就需收集data了。

有了充沛的标注数据集,这个问题就容易解决了。计算方法就是,比如,s后面接t的次数/s出现的个数=s后面接t的概率


HMM – How to do POS Tagging?

回到我们的任务是,有了句子x,找y,而y是未知的。
通过上面得到的几率,我们要把y找出来。

自然而然会想到是,概率最大的就是y,通过穷举y就可以实现。

HMM – Viterbi Algorithm

维特比算法

我们会发现,穷举的思想虽然容易想到,但是计算数量级会很大,还好我们有维特比算法来降低计算量。


HMM-Summary

HMM-Drawbacks

但是HMM有个问题,会脑补没有出现过的句子,很可能在training data中没有出现过的搭配却表现地不错,这种特点说明它在数据很少的时候是比较适用的。
那么为什么会产生这种脑补的现象,因为对他来说,transition probability和deviation 的probability是independent。

那么CRF就能解决这一问题。

(下接part 2 )

[机器学习入门] 李宏毅机器学习笔记-29 (Sequence Labeling Problem part 1;结构化预测-序列标记 part 1)相关推荐

  1. 《基于张量网络的机器学习入门》学习笔记7

    <基于张量网络的机器学习入门>学习笔记7 量子算法 什么是量子算法 三个经典量子算法 Grover算法 背景 基本原理 例题 量子算法 什么是量子算法 例如我们求解一个问题,一个111千克 ...

  2. 《基于张量网络的机器学习入门》学习笔记6

    <基于张量网络的机器学习入门>学习笔记6 密度算符(密度矩阵) 具体到坐标表象 在纯态上 在混合态上 纯态下的密度算符 混合态下的密度算符 密度算符的性质 量子力学性质的密度算符描述 第一 ...

  3. 《基于张量网络的机器学习入门》学习笔记5

    <基于张量网络的机器学习入门>学习笔记5 量子概率体系 事件 互斥事件 概率与测量 不相容属性对 相容属性对 量子概率与经典概率的区别 量子测量 量子概率体系 我们将经典的实数概率扩展到复 ...

  4. 《基于张量网络的机器学习入门》学习笔记4

    <基于张量网络的机器学习入门>学习笔记4 量子概率 将概率复数化 分布与向量的表示 事件与Hilbert空间 不兼容属性及其复数概率表示 为什么一定要复数概率 量子概率 将概率复数化 在经 ...

  5. 《基于张量网络的机器学习入门》学习笔记8(Shor算法)

    <基于张量网络的机器学习入门>学习笔记8 Shor算法 来源 Shor算法的大致流程 因数分解 周期求取与量子傅里叶变换(QFT) Shor算法 来源 1994 1994 1994年,应用 ...

  6. python3中多项式创建_机器学习入门之机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合...

    本文主要向大家介绍了机器学习入门之机器学习之路:python 多项式特征生成PolynomialFeatures  欠拟合与过拟合,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助. 分享 ...

  7. l2正则化python_机器学习入门之机器学习之路: python线性回归 过拟合 L1与L2正则化...

    本文主要向大家介绍了机器学习入门之机器学习之路: python线性回归 过拟合 L1与L2正则化,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助. 正则化:    提高模型在未知数据上的 ...

  8. A.机器学习入门算法[七]:基于英雄联盟数据集的LightGBM的分类预测

    [机器学习入门与实践]入门必看系列,含数据挖掘项目实战:数据融合.特征优化.特征降维.探索性分析等,实战带你掌握机器学习数据挖掘 专栏详细介绍:[机器学习入门与实践]合集入门必看系列,含数据挖掘项目实 ...

  9. matlab 职坐标,机器学习入门之机器学习实战ByMatlab(四)二分K-means算法

    本文主要向大家介绍了机器学习入门之机器学习实战ByMatlab(四)二分K-means算法,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助.前面我们在是实现K-means算法的时候,提到 ...

  10. 机器学习入门 01 —— 机器学习概述

    文章目录 系列文章 机器学习概述 1.1.人工智能概述 1 人工智能应用场景 2 人工智能小案例 3 人工智能发展必备三要素 4 人工智能.机器学习和深度学习 5 小结 1.2.人工智能发展历程 1. ...

最新文章

  1. mysql data ibdata1_database - 如何在MySQL中收缩/清除ibdata1文件
  2. 李航「机器学习」最全综述
  3. 是你的数据还不够强!谷歌大脑「数据增强」开源,大神QuocLe出品
  4. 谈谈考研复试的一些经验和建议
  5. 《Spark大数据分析:核心概念、技术及实践》一3.5 API
  6. php 判断点在多边形内,PHP判断点是否在多边形区域内外
  7. VC++6.0安装步骤
  8. Jmeter 获取、读取token 供其他 HTTP 请求调用
  9. Kibana插件sentinl实现邮件报警
  10. vue查询列表中所有用户信息_vue实现全匹配搜索列表内容
  11. 使用URLDecoder对URL进行中文解析
  12. vue 接口请求下载文件
  13. excel两列数据对比找不同_Excel快速核对数据,不用函数这招让你3秒搞定,建议收藏...
  14. TCC(TinyC)编译器汉化(中文编译器、汉语编程)之四:语法分析上
  15. 3分钟了解今日头条推荐算法原理
  16. picpick截图工具截取滚动窗口只滚动一次就结束了解决办法
  17. ubuntu安装mysql安装包_ubuntu安装mysql
  18. Windows下python程序报错Nomodule named 'gevent'解决及ERROR: xxx.whl is not a supported wheel on this platform
  19. Educational Codeforces Round 89 (Rated for Div. 2) D. Two Divisors(数论)
  20. pwm频率输出不对解决思路

热门文章

  1. 论文笔记 Acquiring Common Sense Spatial Knowledge through Implicit Spatial Templates (AAAI2018)
  2. 开发公链需要多少钱 开发公链区块链的搭建费用
  3. 统计学cv值是什么意思_什么是CV值
  4. 【黑金原创教程】【Modelsim】【第五章】仿真就是人生
  5. 008 使用MyBatis,easyUI实现CRUD操作样例-CUD(CRUD完毕)
  6. 关于Raster的理解
  7. 灰色关联分析法详细步骤解释
  8. Optional使用示例
  9. Django项目(五):注册模块—登录注册
  10. 在 Cocos Creator 中使用缓动系统(cc.tween)