Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。

文章梗概

马尔科夫是何人?

马尔科夫性质是什么?

马尔科夫模型是什么?

是什么让马尔科夫模型成为隐性的?

一种能够用于条件检测的马尔科夫模型

结论

参考文献

马尔科夫是何人?

马尔科夫是一位俄国的数学家,他最为人所知的是他在随机过程方面的研究。他早期研究的重点是数论而在1900年之后他所研究的重点转向了概率论。他研究的成果颇丰以至于在他1905年正式退休之后他仍然在教授课程直至去世。在他的研究中,马尔科夫成功地拓展了大数定理以及中心极限定理,并将其应用于由独立随机变量组成的特定序列中,如今这也被称为马尔可夫链。马尔可夫链被广泛的运用于物理学,经济学,统计学,生物学等方面。两个最著名的应用是布朗运动以及随机漫步。

什么是马尔科夫性质?

一类随机过程:在给定当前状态的条件下,将来的状态独立于过去的状态。

假定我们用一枚正反面概率一样的硬币玩一个简单的抛硬币的游戏。抛去质疑,假设马尔科夫性质不是已知的,并且我们希望去预测在十次抛掷以后,第11次正面朝上的概率。在条件依赖的假设之下(硬币对于过去的状态有记忆特性并且未来的状态也依赖于过去状态的序列),我们必须记录导致第11次结果的前十次结果的特定序列,并计算它们的联合概率。这个序列的联合概率就是0.5^10 = 0.0009765625。在条件依赖下,第十一次抛掷正面朝上的概率就是0.0009765625 * 0.5 = 0.00048828125。

这真的是第十一次抛掷正面朝上的概率吗?当然不是!

我们知道硬币抛掷这一事件并不依赖于先前抛掷的结果。这枚硬币并没有记忆特性。这个连续抛掷的过程并没有编码先前的结果。每个抛掷都是独立事件并且是正反面概率一致的,又叫做与过去状态的条件独立。这就是马尔科夫性质。

什么是马尔科夫模型?

马尔科夫链(模型)描述了一类随机过程,假定未来状态的概率仅仅依赖于当前状态,不依赖于先前的状态。

让我们以一个简单的例子开始。假设你的小狗处于三类状态之一,在给定当前状态的条件下,你想要模拟出未来状态的可能性。为此我们需要去指定状态空间,初始概率和转移概率。

想象一下你有一只非常懒的胖狗,所以我们定义了状态空间为:睡觉,吃饭,赖皮。我们设置对应的初始概率为 35%, 35%,和 30% 。

下一步就是定义转移概率。在给定当前状态的条件下,他们就是保持相同状态的概率或者转移到不同状态的概率。

既然我们有了初始概率和转移概率,我们就能用Networkx包来创建马尔科夫图表了。

要做到这一点需要一点点灵活思考。Networkx创造了包含很多节点和边的图形。

在我们这个小例子中,小狗可能的状态是这些节点,而边则是连接各个节点的连线。而转移概率则是权重。它们代表了在当前状态已知的情况下转移至下一状态的概率。

有一点需要指出的是networkx主要是用来处理字典对象的。也就是说,我们需要去创建一个包含边以及对应权重的字典对象。

现在我们能够创建这个图表。为了能够使得马尔科夫模型可视化需要使用nx.MultiDiGraph()。一个多有向图简单来说就是有方向的图表,能够拥有多条弧,同时单个节点既可以是起始点也可以是终点。

在接下来的代码中,我们将创建图标对象,添加我们的节点,边和标签,接着画一个大致的netwokx图线,并且将其输出为dot文件。

现在让我们看看这个dot文件。

还可以吧。如果你想从任意节点开始沿着某一条边,他会告诉你这条小狗从一个状态转化为另一个状态的概率。举个例子来说吧,如果这条狗正在睡觉,我们能够发现有40%几率这条狗会继续睡觉,40%的几率狗会醒来并且耍赖皮,还有20%的概率狗会醒过来吃饭。

什么使得马尔科夫模型成为隐性的?

假设这样一种情况:你的狗突然举止怪异,你想要去模拟出狗是由于生病而有怪异行为的概率或者是在健康状态下纯粹地搞怪的概率。

在这一情形下,狗的真正状态是未知的,并且你也是不知晓的。一条可行的方法就是假设狗有一些可被观察的行为,这些行为能够代表正确而隐性的状态。让我们通过一个例子来了解。

首先我们创建状态空间,健康或生病。我们假设它们是等概的。

现在我们为隐藏状态创建转移矩阵。

这就让它变得更有趣一点了。现在我们创建发射或者观察概率矩阵。这个矩阵的大小是M x O 的,并且M是隐藏状态的个数,而O则是可能观察到的状态的个数。

这个发射矩阵告诉我们,在可能当前以及可观察的状态条件下,狗处于其中一个隐藏状态的概率。

让我们保留前一个例子中的可观察状态。这条狗能够睡觉,吃饭或者耍赖皮。这样我们就能根据这些概率做出最准确的猜测。

现在我们创建图表的边和图表对象。

这个隐性的马尔科夫的图表有一些复杂但其原理是一样。举个例子来说,你能够预测到,如果你的小狗在吃饭,那它有极高的可能是健康的(60%),而有非常低的可能是生病的(10%)。

现在,给定一组你的小狗的行为序列,如果你需要识别出小狗随着时间变化的健康状态又该怎么办呢?

使用维特比算法我们可以在给定行为序列的条件下,求出其最可能的对应的隐藏状态的序列。

高水平下,这个维特比算法增量随着每个时间的步进,找到所有路径中能够以最大可能性到达时间t下的状态i的路径,这条路径也是到达时间t的正确观察行为序列。

这个算法也能够保存在每一个阶段下有最高概率的状态的踪迹。在序列的结尾,这一算法将会向后迭代计算出在每一个时间步长中“胜利”的状态,并建立最有可能的路径,或者最有可能的隐藏状态的序列,这些都与已知的行为序列相对应。

让我们看一下结果吧。

一种可用于条件检测的隐性马尔科夫模型

到现在,你可能想知道我们怎么样去将我们所学的马尔科夫模型应用在定量金融中。

但考虑到当我们想要尝试在资产收益率中应用预测技术时,所面临最大的困难就是资产收益率是非平稳时间序列。简单来说,这就是意味着资产收益率的预期均值以及波动性都会随着时间而变化。

大多数时间序列的模型都是假设数据是平稳的。这就是这些模型主要的缺陷。

但是,让我们从问题的另外一面思考。我们知道这个时间序列其实表明了当前的时间点下预期均值以及波动性是固定不变的。而这些时间点或者说是条件就可以比喻为隐性状态。

如果是这样的话,我们就只需要得到这些拥有与隐性状态对应特征的观察变量就可以了。如果我们能够更好地预估出资产所处在的最可能的环境,包括它的联合均值和方差,那么我们的预测模型就能变得更加灵活,并且能够提高准确度。当然如果给定的这些条件预估参数能够组成更有利于情景分析的框架,我们也能够成为更优秀的风险管理人员。

在这个例子中,我使用的观测变量有:潜在的资产回报,泰德价差,10年- 2年连续成熟的范围,和10年-3个月的连续成熟的范围。

我们能从雅虎财经上采集这些数据。

下面我们将会用到sklearn的高斯混合模型来组成一个能够预测这些条件的模型。我们将会在这个系列的第二部分深度探讨混合模型这个版块。而最重要的特点是,混合模型应用一种密度估算中无人监测的形式来进行实现。他利用最大化均值算法来估算隐性状态的的均值和协方差。现在,就可以按下这个按钮,来猜猜转移和发射概率以及最可能的路径。

我们必须选定混合模型中组件的数量来和时间序列相拟合。在这个例子中这些组件就被当作隐性状态。我们将这些状态任意划分为高,中和低波动性并且将组件部分设置为3。

在上面的图片中,我圈出了每个条件下所对应的每日收入的预期均值和方差。我们的低波动性环境就是我们序号为1的隐性状态。我们也能发现序号为1的隐性状态下有最高额的收入均值和最小的方差。而序号为0的隐性状态即为中性的波动性环境,对应的是第二高的回报和方差。最后的序号为2的隐性状态即为高的波动性环境,对应的是负的回报以及最大的方差。

下面的图是用颜色代表各个隐性状态的美容价格走势。

总结:

这篇文章中我们讨论了马尔科夫性质的概念,马尔可夫模型和隐性的马尔可夫模型。我们使用NetworkX包创建马尔科夫链图,并用sklearn的高斯混合模型预测以往各个节点的状态。在第2部分,我们将深入讨论混合模型。为了了解更详细的信息,我建议你多看看参考文献中的内容。特别是Setosa.io这个网站由于其有极好的交互式的视觉体验,有助于你更好地理解这篇文章。

参考文献:

1.     https://en.wikipedia.org/wiki/Andrey_Markov

2.     https://www.britannica.com/biography/Andrey-Andreyevich-Markov

3.     https://www.reddit.com/r/explainlikeimfive/comments/vbxfk/eli5_brownian_motion_and_what_it_has_to_do_with/

4.     http://www.math.uah.edu/stat/markov/Introduction.html

5.     http://setosa.io/ev/markov-chains/

6.     http://www.cs.jhu.edu/~langmea/resources/lecture_notes/hidden_markov_models.pdf

7.     https://github.com/alexsosn/MarslandMLAlgo/blob/master/Ch16/HMM.py

8.     http://hmmlearn.readthedocs.io

英文原文:http://www.blackarbs.com/blog/introduction-hidden-markov-models-python-networkx-sklearn/2/9/2017

译者:铁柱哥爱33

python做马尔科夫模型预测法_通过Python的Networkx和Sklearn来介绍隐性马尔科夫模型...相关推荐

  1. python做马尔科夫模型预测法_用Python实现马尔可夫链蒙特卡罗

    摘要: 本文通过用Python中的马尔可夫链蒙特卡罗实现了睡眠模型项目,并教会如何使用MCMC. 在过去的几个月里,我在数据科学领域里遇到一个术语:马尔可夫链蒙特卡罗(MCMC).在博客或文章里,每次 ...

  2. python模型预测足球_采用 Python 机器学习预测足球比赛结果!买谁赢就谁赢!

    采用 Python 机器学习预测足球比赛结果 足球是世界上最火爆的运动之一,世界杯期间也往往是球迷们最亢奋的时刻.比赛狂欢季除了炸出了熬夜看球的铁杆粉丝,也让足球竞猜也成了大家茶余饭后最热衷的话题.甚 ...

  3. python做马尔科夫模型预测法_李航《统计学习方法》第十章——用Python实现隐马尔科夫模型...

    相关文章: 李航<统计学习方法>第二章--用Python实现感知器模型(MNIST数据集) 李航<统计学习方法>第三章--用Python实现KNN算法(MNIST数据集) 李航 ...

  4. python做马尔科夫模型预测法_隐马尔可夫模型的前向算法和后向算法理解与实现(Python)...

    前言 隐马尔可夫模型(HMM)是可用于标注问题的统计学习模型,描述由隐藏的马尔可夫链随机生成观测序列的过程,属于生成模型. 马尔可夫模型理论与分析 参考<统计学习方法>这本书,书上已经讲得 ...

  5. python 预测足球_利用 Python 预测英雄联盟胜负,分析了 5 万多场比赛才得出的数据!...

    今天教大家用Python预测英雄联盟比赛胜负. Show me data,用数据说话 今天我们聊一聊 Python预测LOL胜负 目前,英雄联盟S10全球总决赛正在火热进行中,最终决赛于10月31日在 ...

  6. python神经网络预测股价_用Python预测股票价格变化

    长短期记忆(英语:Long Short-Term Memory,LSTM)神经网络,是一种时间递归神经网络(RNN),该网络适合于处理和预测时间序列中间隔和延迟非常长的重要事件,如股票价格预测和水文预 ...

  7. 使用python预测基金_使用python先知3 1创建预测

    使用python预测基金 This tutorial was created to democratize data science for business users (i.e., minimiz ...

  8. 0基础学python做什么工作好-写给0基础小白:Python能干什么?就业前景好不好?怎么开始学?...

    原标题:写给0基础小白:Python能干什么?就业前景好不好?怎么开始学? 今天,我们深度了解一下Python这门语言,它到底是什么,都能用来干什么,为什么这么火? 首先,普及一下编程语言的基础知识. ...

  9. erwin模型怎么保存_一行命令启动,十分钟内完成部署,Paddle Serving开放模型即服务功能...

    机器之心发布 机器之心编辑部 百度飞桨的 Paddle Serving 能够实现服务器端快速部署,最近,随着飞桨更新到 1.7 版本,Paddle Serving 也有了新变化.更新后的 Paddle ...

最新文章

  1. 腾讯35亿美元抄底收购搜狗,产品张小龙和技术王小川双剑合璧
  2. python 操作txt 写入列表
  3. 计算机多媒体思政课,浅论多媒体教学手段在思政课教学中的运用
  4. 2016-12-17 新浪博客服务器挂掉了,所有博客页面都无法打开
  5. 产生死锁的四个必要条件
  6. 刚刚教育部发声:老师性骚扰学生 零容忍!“害群之马”将被严惩
  7. linux集成安装步骤,TeamCity 持续集成在Linux的安装
  8. python二维列表的展开_python将三维数组展开成二维数组的实现
  9. mysql 命令类型_mysql 基本命令(3)-数据类型和运算符
  10. MapGIS考试大纲
  11. 图像处理的OTSU算法
  12. v中国瓶装水市场营销状况与销售动态分析报告2022-2027年
  13. Android App 安全登录认证解决方案
  14. c# workflow集成_将Google Wave与Windows Workflow集成
  15. 关于(archive)归档和(unarchive)解档的处理。
  16. 【AI人工智能】AI绘画能取代设计师?
  17. 轻松搞定 Spring Cloud 2.x 微服务全家桶
  18. 趣味数学(各大经典数学问题)
  19. Hbuildx 无法运行项目的问题
  20. (PL2303)Prolific usb-to-serial在WIN7, WIN8和WIN10上驱动的问题

热门文章

  1. 电影院和计算机的英语怎么说,电影院英文,在电影院用英语in还是at!
  2. stm32学习开发记录:OLED——I2C
  3. jstack分析 (Thread state=IN_NATIVE) mark
  4. 查看Java元空间区域
  5. 如何计算2个矩阵的相似性?
  6. imregionalmin
  7. Linux背后的大脑-传奇人物Linus
  8. Docker知识点整理
  9. STM32RCT6芯片引脚的含义与作用
  10. vue 安装不上,报错,解决办法如下