链接 https://www.bilibili.com/video/BV1by4y1k7rc?p=6

北京大学生物信息学公开课之动态规划进行2序列比对

掌握主流的生物信息学的原理,然后让生物信息学为你所用,,知其道用其妙

对当前流行的软件的分析

主要包括以下几方面

生物信息学分析

来自灵魂的拷问

1.生物学问题  软件需要解决的生物学问题和背景是什么???

2.使用这种方法需要什么样的数据,需要哪些参数??

3.如何将生物学问题通过建模形成计算机能够解决的生物学模型??

4.模型的实现需要的算法??

比如序列比对分析

生物学问题

序列比对的重要性(主要基于的问题 ::: 1.相似的结构具有相似的功能,2.不同的物种中,相似的序列是构建演化关系的重要因素

那么经典的常用的动态规划进行序列比对的方法Needleman-Wunsch 算法

序列比对常见的网站https://www.ebi.ac.uk/Tools/psa/emboss_matcher/

比对结果的解读

比对的结果通过一个替换矩阵来分析

第5个位置S向T 的替换得到的矩阵的分数是1>0,在结果显示中是冒号:

而对于替换的结果是-1 的时候,在结果显示中是. 表示相似性较差。

每个氨基酸的比对是相互独立的

那么对于其中空位的部分,正在一条序列上的空位,另一条序列上就是插入

对于空位会产生罚分

最终的得分是是全部的惩罚分数之和。

利用动态规划进行全局比对

2条序列的比对

核苷酸的数目为n

那么所有比对的结果是在2n 个位置上放n个空位的组合

也即是2n 个数据里面选取n个的组合数

1个碱基序列比对的结果,比对到另一个核苷酸或者1个空位

因此总的比对分数等于当前每个残基比对的结果之和,因此序列比对的问题可以分解为

当前最好的比对结果加上后期比对最好的结果,也就是转化为动态规划的问题

动态规划进行全局的比对,理论公式全局最优解等于当前最优解+下一个比对的最优解

设置最初始的比对结果是F(0,0)=0

在本例中的惩罚分数是d=-5,不同的替代之间的结果是,同一替代是2分,A/C是-7,A/G是-5,A/T也是-7。

动态最优规划

在计算的过程中,每个格子只考虑它上方和左侧的分数来源,在所有的结果中,取最大的分数作为最终的分数,用于下一次的计算

举例子

动态规划矩阵

每个格子选取所有可能性中最大的分数,那么对于上述的矩阵,第一列和第一行的分数分别为-5,-10,-15,然后从左边和上边分别得到当前的分数,选取最大的作为最大的得分

最终得到的最优的比对结果

最后优AAG 和AGC 三个碱基的比对序列,得到的最优结果如上2个,最终的得分为-6。

生物信息学序列比对

北京大学生物信息学学习(3动态规划进行2序列比对的原理 )相关推荐

  1. 北京大学生物信息学学习(6)隐含马尔可夫模型

    北京大学生物信息学学习(6)隐含马尔可夫模型 马尔可夫链(时间和状态都离散的状态组合) https://www.bilibili.com/video/BV13t411G7oh?p=14 隐含马尔可夫模 ...

  2. 北京大学生物信息学学习(7)NGS 分析

    第二代基因组测序 深度测序产生的FASTQ 数据 Q值会通过转化表编码成ASCI码保存在FASTQ数据中 通过质量信息,常将质量分数小于20,即错误概率大于0.01 的碱基认为是不可靠的,如果这样的剪 ...

  3. 北京大学生物信息学 (4)序列数据库

    北京大学生物信息学 (4)序列数据库 https://www.bilibili.com/video/BV13t411G7oh?p=9&spm_id_from=pageDriver 搜库算法 B ...

  4. 北京大学生物信息学课程(5)

    北京大学生物信息学课程(5) 马尔可夫模型的学习 马尔可夫模型 未来的状态至于当前的状态和状态的转移概率有关,而与之前和过往的状态无关. 空位罚分 引入了Gap open 和Gap extending ...

  5. 北京大学生物信息学(3)

    北京大学生物信息学(同源性,相似性,相似矩阵) 如何使用计算机来识别相似性,使用相似矩阵 多序列比对 蛋白质打分比对矩阵 常用的蛋白比对的算法BLOSUM 蛋白质的演化过程 PAM2表示从A2步到A的 ...

  6. 北京大学生物信息学(9)第二代基因组测序技术

    北京大学生物信息学(9)第二代基因组测序技术 如何预测一个遗传变异的功能及其对表型的变化 https://www.bilibili.com/video/BV13t411G7oh?p=26 常见的二代测 ...

  7. php算法学习,php算法学习之动态规划

    动态规划程序设计是对解最优化问题的一种途径.一种方法,最终问题的最优解可以通过前面子问题的最优解推导出来. 对于动态规划这个算法,自己学习的还不是很透彻,简单的总结自己学习的感受是: 动态规划思想中融 ...

  8. 强化学习算法在京东广告序列推荐场景的应用实践

    猜你喜欢 0.淘宝首页猜你喜欢推荐建模实践 1.[免费下载]2022年3月份热门报告 2.[实践]小红书推荐中台实践 3.微信视频号实时推荐技术架构分享 4.对比学习在宽狩推荐系统中的应用实践 5.微 ...

  9. 【推荐实践】强化学习算法在京东广告序列推荐场景的应用

    猜你喜欢 0.搜狗信息流推荐系统架构及推荐算法实践1.如何搭建一套个性化推荐系统?2.京东推荐算法精排技术实践3.[万字长文]某视频APP推荐算法及策略详解4.微博推荐算法实践与机器学习平台演进5.腾 ...

最新文章

  1. Windows Mobile 5.0 中为开发人员提供的新功能(3)
  2. 【Windows 逆向】CheatEngine 工具 ( 汉化版 CE 工具推荐 | 编写简单 C++ 程序 | C++ 程序执行分析 | 使用 CE 修改上述 C++ 程序 )
  3. B/S和C/S的区别
  4. python词频统计代码_python统计词频
  5. .NET中的值类型与引用类型
  6. 【Java开发工具】Generator:Java代码生成工具
  7. Tomcat中的ResourceBundle国际化解析
  8. excel数据分析模块
  9. JBX IDE中文输入
  10. 树莓派4B WIFI 物理网口设置固定IP方法
  11. 批量识别PDF/OFD/PNG/JPG电子发票到EXCEL
  12. 安卓逆向例子--某菠菜APP token pwd 参数
  13. 有关FLOPS的定义与计算
  14. SOA 架构中的ESB是更好的应用于异构系统集成整合还是用于统一服务调用/基础服务实施...
  15. Effie 与文字讲缘分,与写作者交朋友
  16. 台式电脑组装的步骤~~~~·
  17. P3763 [TJOI2017]DNA (FFT)
  18. 进阶版的Java发牌小程序
  19. 有手就行的 Spring Boot 集成 Shiro
  20. 4K+AI将加速催生5G时代颠覆性应用

热门文章

  1. 关于IIS不能浏览ASP网页 和不能浏览后台(转)
  2. WebRTC报错:depot_tools/bootstrap_python3: um.8_bin/python3/bin/python3: 没有那个文件或目录(三)
  3. 二分查找时间复杂度分析
  4. 系统签名缺少libconscrypt_openjdk_jni.so解决
  5. C++使用using与typedef定义别名
  6. linux /dev/null用法
  7. python之slice,range
  8. tensorflow之reshape
  9. go语言学习之helloword
  10. LED显示驱动(六):LED显示设备显示单层图片调试(DE驱动测试)