2.1 扩展到HMM

目前我们介绍了Markov模型,其中每个状态和一个可观测(物理)事件相关。这种模型很难应用到很多实际问题中去。这一小节,我们拓展Markov模型,考虑观测是状态的概率函数的情况,这样得到的模型(称为HMM)是双随机过程,其中底层的随机过程是观测不到的,只能观测到生成观测序列的那个随机过程。下面介绍一个抛硬币的例子。

抛硬币模型:假设你在一个有帘子的房间中,因为帘子阻挡了视线,你看不到发生了什么。帘子的另一面有个人正在抛一个硬币(或者多个)。这个人不会准确告诉你他正在做什么事,他只会告诉你每次抛硬币的结果。这样一组隐藏抛硬币实验就完成了,能观测到的序列是一组正或反序列,即

OO1O2O3⋯OT==HHTTTHTTH⋯H

\begin{align}O&=\\{O_1O_2O_3\cdots O_T\\} \nonumber \\\\&={\cal HHTTTHTTH}\cdots {\cal H} \nonumber\end{align}

其中 H \cal H表示正面, T \cal T表示反面。

我们该如何构造一个HMM来解释观测到的正反序列呢?首先,我们需要确定这个模型中的状态是什么,并且确定有多少状态。一个简单的设置是假设只有一个硬币。这样我们用2状态模型就可以对这种情况建模,每个状态表示硬币的正面或者反面,模型如图2(a)所示。这种情况下,Markov模型是可以观测到的,我们只需要确定抛出正面或者反面的概率(称为硬币的偏置),就可以确定这个模型。有意思的是,等价于图2(a)的HMM是一个退化的1状态模型,其中状态表示这个硬币,未知参数是硬币的偏置。

第二种HMM如图2(b)所示。这种情况下,模型有两种状态,每种状态代表不同的硬币。每个状态由正反面的概率分布进行表征,并且用状态转移矩阵来表征状态转移。

第三种HMM如图2(c)所示。这个模型中有三个硬币,根据某种概率分布随机地选择一个硬币,然后进行抛掷。

给定上面三种模型后,我们希望知道哪个模型最好地解释了实际观测序列。现在,1-硬币模型中只有一个未知参数;2-硬币模型中有4个未知参数;3-硬币模型中有9个未知参数。由于最大的HMM有更大自由度,所以似乎能更好地对抛硬币实验进行建模。尽管理论上这是正确的,我们后面会看到实际问题会对模型的大小施加一些约束。而且实际上可能真的只有一个硬币。所以直接使用图2(c)中的3-硬币模型并不合适。

碗中的球模型:为了把HMM的思想应用到更复杂的情况中去,考虑图(3)中的碗中的球系统。假设房间中放了 N <script id="MathJax-Element-4" type="math/tex">N</script>个玻璃碗,一人根据某个随机过程选择第一个碗,然后从这个碗中随机选择一个球,这个球的颜色作为观测值。然后把球放回到这个碗里面。然后根据当前碗的随机选择过程,再选择一个新的碗,然后从碗里面选择一个球。重复这个过程。最后得到有限个颜色观测序列,我们可以把它作为HMM的观测输出。

很明显,这个系统的最简单的HMM是让每个状态表示一个碗,并且定义每个状态的颜色概率。HMM的状态转移矩阵决定了碗的选择。

HMM经典介绍论文【Rabiner 1989】翻译(三)——抛硬币实验和碗中的球实验相关推荐

  1. HMM经典介绍论文【Rabiner 1989】翻译(一)——介绍

    A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition Rabiner, 1989. 尽管 ...

  2. 经典神经网络论文超详细解读(三)——GoogLeNet InceptionV1学习笔记(翻译+精读+代码复现)

    前言 在上一期中介绍了VGG,VGG在2014年ImageNet 中获得了定位任务第1名和分类任务第2名的好成绩,而今天要介绍的就是同年分类任务的第一名--GoogLeNet . 作为2014年Ima ...

  3. 经典神经网络论文超详细解读(二)——VGGNet学习笔记(翻译+精读)

    前言 上一篇我们介绍了经典神经网络的开山力作--AlexNet:经典神经网络论文超详细解读(一)--AlexNet学习笔记(翻译+精读) 在文章最后提及了深度对网络结果很重要.今天我们要读的这篇VGG ...

  4. 经典神经网络论文超详细解读(八)——ResNeXt学习笔记(翻译+精读+代码复现)

    前言 今天我们一起来学习何恺明大神的又一经典之作: ResNeXt(<Aggregated Residual Transformations for Deep Neural Networks&g ...

  5. 干货警告!国外有个小姐姐给29篇经典机器学习论文写了总结 | 资源

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 如果你想在人工智能领域深耕,阅读经典论文是一个必须要做的事情. 但是,怎么读?读哪些?论文中哪些是关键?都是需要让人去琢磨的地方. 最近, ...

  6. 机器学习经典书籍论文

    原文地址:http://blog.sina.com.cn/s/blog_7e5f32ff0102vlgj.html 入门书单 1.<数学之美>PDF6 作者吴军大家都很熟悉.以极为通俗的语 ...

  7. 【论文】轻量级网络squeezenet论文的详细翻译

    前言: 整体上翻译了squeezenet:AlexNet-level accuracy with 50X fewer paramenters and 0.5MB model size.这篇论文,便于英 ...

  8. 【论文简述及翻译】PSMNet:Pyramid Stereo Matching Network(CVPR 2018)

    一.论文简述 1. 第一作者:Jia-Ren Chang 2. 发表年份:2018 3. 发表期刊:CVPR 4. 关键词:端到端训练.连接体.空间金字塔池化.堆叠沙漏的3D CNN.回归 5. 探索 ...

  9. 【论文简述及翻译】ACVNet:Attention Concatenation Volume for Accurate and Efficient Stereo Matching(CVPR 2022)

    一.论文简述 1. 第一作者:Gangwei Xu,Junda Cheng 2. 发表年份:2022 3. 发表期刊:CVPR 4. 关键词:端到端训练.代价体.注意力机制.3D聚合.回归 5. 探索 ...

最新文章

  1. python数据预测模型算法_如何对时间序列预测问题计算基准预测(python)
  2. Opensmile 简介
  3. C语言中sizeof()的用法
  4. java程序结构_Java 程序结构说明(学习 Java 编程语言 004)
  5. 观察:谁能拯救视频平台的高昂带宽成本?
  6. 新入驻博客园立一个flag
  7. 数据库查询求小于_SQL学习笔记(二)简单查询
  8. media player的显示模式 winform
  9. jquery-滑动的选项卡
  10. HTML5的input color系统颜色选择器
  11. python实现:用类实现一个图书馆,实现借书,入库,还书,查书,等功能,要求数据可以保存到文件中,退出后下次可以找回数据...
  12. 41.django中auth用户认证
  13. 详细分析MOS管缓启动电路及其原理详解
  14. Office - 0x4004F00C解决方法
  15. switch游戏服务器设置
  16. 卫星导航系统的发展历史
  17. python re search match_简诉Python Re模块中re.search和re.match的区别
  18. 乐观锁 VS 悲观锁
  19. Unity植物大战僵尸游戏素材+源码
  20. 中国水果和蔬菜种子市场趋势报告、技术动态创新及市场预测

热门文章

  1. java基于微信小程序的药品购物商城系统 自助购药小程序uinapp 计算机毕业设计
  2. cvcvtcolor_cvCvtColor实现色彩空间转换
  3. caffe之deconv
  4. 会议是浪费工作时间的最佳去处
  5. clang-tidy学习笔记-1
  6. 故障诊断期刊文献分析
  7. 男子用棒打狗却失手打死了自己的2岁亲生女儿,法院判了
  8. Sersync 实时同步
  9. 君正 T31 真正能用的编译 Openssl 方法
  10. Spark学习笔记09:Scala类和对象