北京大学生物信息学学习(6)隐含马尔可夫模型

马尔可夫链(时间和状态都离散的状态组合)

https://www.bilibili.com/video/BV13t411G7oh?p=14

隐含马尔可夫模的例子

状态路径和符号路径

给定一个基因序列,来预测基因的编码和非编码区(编码和非编码为不可见的状态)

在这个过程中,需要转移概率矩阵(即状态转移的一个概率矩阵)

需要生成概率,在此处也就是(在编码条件下和非编码条件下,AT,G,C出现的概率,这个需要根据大量的统计数据集进行统计分析或者预测分析)

需要训练集,一个已知注释过的编码和非编码注释过的数据集,需要一个长的数据集,来得到上面矩阵中的数据即编码和非编码的概率以及在编码和非编码的情况下的A,T,C,G的概率。

那么经过上述的训练数据集得到了上述的两个矩阵,那么接下来,通过模型构建,我们来预测未知的序列是编码和非编码区的概率。

在此,为了避免数据太小产生的数据下溢,所以老师对数据进行log 转化,以下是计算数据的一个转移的状态矩阵,首先假设从非编码状态开始n的取值是0.2和0.8 的一个log 转换,因此乘法运算再次转换成了加法运算。

对于上述的隐含马尔可夫模型的例子

Example  1

女盆友的状态  开心or 不开心

行为  Kiss、Beat、Do nothing

对于每一个状态之间的转换之和为1

那么根据第三天女盆友的状态Do nothing  来猜测女盆友的状态,开心or 不开心????

Example2  5'剪切位点的识别

输出的状态  外显子E  5识别位点, 内含子I

Example 3  Coding region 的预测,基于起始密码子ATG 和终止密码子TAA 的计算方法。

Example 4  原核生物的基因的定义

Example5  真核生物的基因

Example6真核基因2

Example7  天气和水藻的状态

隐含马尔可夫模型的评估的方法 前向算法和反向算法  维特比算法和BW 算法

Example8  利用HMM模型来寻找CNV

CNV 的明确定义

转移矩阵

2个生成矩阵

北京大学生物信息学学习(6)隐含马尔可夫模型相关推荐

  1. 转:从头开始编写基于隐含马尔可夫模型HMM的中文分词器

    http://blog.csdn.net/guixunlong/article/details/8925990 从头开始编写基于隐含马尔可夫模型HMM的中文分词器之一 - 资源篇 首先感谢52nlp的 ...

  2. 从头开始编写基于隐含马尔可夫模型HMM的中文分词器之一 - 资源篇

    首先感谢52nlp的系列博文(http://www.52nlp.cn/),提供了自然语言处理的系列学习文章,让我学习到了如何实现一个基于隐含马尔可夫模型HMM的中文分词器. 在编写一个中文分词器前,第 ...

  3. 数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用

    发表者:吴军,Google 研究员 前言:隐含马尔可夫模型是一个数学模型,到目前为之,它一直被认为是实现快速精确的语音识别系统的最成功的方法.复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述. ...

  4. 隐含马尔可夫模型在语言处理中的应用(Z)

    Original address: http://www.google.com.hk/ggblog/googlechinablog/2006/04/blog-post_1583.html 数学之美 系 ...

  5. 数学之美-隐含马尔可夫模型-笔记

    <数学之美>吴军 著 第二版 --读书笔记 原理 通信模型: Created with Raphaël 2.1.2信息.上下文信息.上下文传递的信息传递的信息接收的信息接收的信息(s1,s ...

  6. 以拼音输入法(自然语言处理)为例,简单理解隐含马尔可夫模型

    最近在学习 语音&搜索 方面的知识,属于从门外汉起步,很多这方面的书在讲解的时候都是要求有相关知识背景或者是一堆公式让像我这样不是学计算机出身而且数学也学得不好的菜鸟看得头晕眼花的,因此特地写 ...

  7. 《数学之美》读书记录【思维导图记录】:第五章,隐含马尔可夫模型

    隐含马尔可夫模型: 补充资料: 状态转移矩阵: 状态转移矩阵是俄国数学家马尔科夫提出的,他在20世纪初发现:一个系统的某些因素在转移过程中,第n次结果只受第n-1的结果影响,即只与当前所处状态有关,而 ...

  8. 数学之美——隐含马尔科夫模型

    隐含马尔科夫模型由美国数学家鲍姆等人在20世纪6070年代提出. 马尔科夫链:也称马尔科夫过程,指符合马尔科夫假设的随机过程. 某个特定的状态序列s1,s2,s3--产生输出序列o1,o2,o3--的 ...

  9. 《数学之美》第5章 隐含马尔可夫模型

    1 通信模型 通信的本质就是一个编解码和传输的过程. 当自然语言处理的问题回归到通信系统中的解码问题时,很多难题就迎刃而解了. 雅格布森通信六要素是:发送者(信息源),信道,接受者,信息, 上下文和编 ...

最新文章

  1. 【CV中的注意力机制】史上最强ResNet变体--ResNeSt
  2. skylake服务器处理器M系列,行业——华为三大v5机架式服务器改用Skylake处理器
  3. Android10崩溃,华为荣耀Android10崩溃
  4. yum标准化安装nginx最新版
  5. 使用gethostname()函数和gethostbyname()函数获取主机相关信息
  6. 产品经理,如何建立自己独特的产品观?(转)
  7. pythonflaskmock数据_Flask实现简单Mock Server
  8. 一个判断session是否过期的小技巧
  9. (转载)简洁、明晰!数据库设计三大范式应用实例剖析
  10. java语言程序设计复习重点_java语言程序设计期末复习要点
  11. windows远程桌面不能复制粘贴的解决办法
  12. 职业教育计算机教学,浅析职业教育中的计算机教学思考.doc
  13. 手机中android版本9是什么,这是Android手机Android 9.0还是Android 6.0?
  14. 将Unity地形以Wavefront Obj格式导出
  15. 5.3.3—二叉查找树—Validate Binary Sear Tree
  16. 计算机域账号更改添加
  17. html平面图绘制,小白福利!超详细平面图绘制
  18. 放大器指标:1db压缩点
  19. 【arcpy批量制图】符号系统的色带、小数点设置
  20. 数值计算之 线搜索法,Armijo,Wolfe,Goldstein条件,回溯法

热门文章

  1. 【转载】通过SQL获取MSSQL的数据库相关信息收藏
  2. 【信息系统项目管理师】第7章-项目成本管理 知识点详细整理
  3. shell逻辑判断和-a区别
  4. 没有博士学位,照样玩转TensorFlow深度学习
  5. Android 反编译 -smali文件对比java文件
  6. 树莓派之安装dlna服务
  7. YOLO: Real-Time Object Detection 遇到的问题
  8. Nginx配置二级域名来实现多个站点
  9. move_uploaded_file返回false但实际成功_023 Spring Boot 搭建实际项目开发框架
  10. python对象的引用_Python 对象引用、可变性和垃圾回收