生物信息学_序列比对(二)替换计分矩阵
在序列比对时,因为空格插入不同产生了多种序列排序方案,可以通过替换计分矩阵这一计分规则来筛选出比对最大相似度的方案。
核酸和蛋白质分别有不同的替换计分矩阵。
核酸
等价矩阵
相同核苷酸之间的匹配得分为1,不同核苷酸间的替换为0。
转换-颠换矩阵
核酸的碱基按照结构可分为两类:
嘌呤(两个环)
嘧啶(一个环)
不同结构之间替换称为颠换,相同结构替换为转换
在进化中转换频率远大于颠换,所以转换得分为-1,颠换为-5。
BLAST矩阵
经过大量实际比较得,核苷酸相同的+5,反之为-4,则效果较好,该矩阵被广泛采用。
蛋白质
等价矩阵
相同氨基酸之间的匹配得分为1,不同氨基酸间的替换为0。
遗传密码矩阵GCM
通过计算一个氨基酸残基转变到另一个氨基酸残基所需的密码子中碱基变化数目而得到的,矩阵元素的值对应于代价。
疏水矩阵
不同的氨基酸具有不同的疏水性,而疏水性对蛋白质的结构和功能有很大影响,所以根据氨基酸替换前后的疏水性变化,进行打分。
PAM矩阵
Dayhoff模型:可接受点突变
有些氨基酸替换较为频繁,自然界易接受这种突变,也就是可接受点突变,得分应该较高
PAM矩阵是目前蛋白质序列比较中最广泛使用的计分方法之一。
PAM矩阵中的元素表示是在一给定进化时期内氨基酸替换为某一氨基酸的变化概率,给定的进化时间就是一个PAM(不同蛋白质的替换速率不同,所以不用时间,以两个蛋白质1%氨基酸发生变化为时间进度),一个PAM内的变化概率也就是PAM-1。
PAM矩阵是通过紧密相关蛋白质序列的比对(>=85%),而研究进化程度较远的蛋白质一般用PAM-N,PAM-N是通过PAM-1自乘n次得到的,最常用PAM-250。
PAM250突变概率矩阵
BLOSUM矩阵
BLOSUM矩阵通过关系较远的序列来获得矩阵元素,这种方法的优点是符合实际的观测结果,不足之处是不能和进化挂起钩来。
BLOSUM的工作集中于远相关蛋白的保守区域上,而BLOSUM-62表示蛋白质的一致度>=62%。
PAM还是BLOSUM?
- PAM-1矩阵是基于相似度较高的序列而来,只描述了在较短进化时期内每个氨基酸发生变化的频度,对于较远进化距离的矩阵并非通过真实数据产生,而是通过PAM-1自乘得到,所以PAM-N不适合用于关系较远的序列比较。
- BLOSUM矩阵基于蛋白质序列块比对,利用相关序列中最相似的共同区域中氨基酸的替换和匹配。
对于关系较远的序列之间的比较,由于PAM-250是推算而来的,所以其精度受到一定的影响,BLOSUM-45更具优势。
对于关系较近的序列之间的比较,由于PAM或BLOSUM矩阵做出的比对结果,差距不大,最常用:BLOSUM-62。
生物信息学_序列比对(二)替换计分矩阵相关推荐
- python中序列类型是二维元素向量吗_序列类型是二维元素向量,元素之间存在先后关系,通过序号访问。...
[填空题]MapReduce 计算模式中, Map (映射)的主要任务是:负责输入数据的 . . ,输出 . [多选题]大数据的特征包括( ). [判断题]中断服务过程中如果允许中断嵌套,则优先级高的 ...
- c语言最长公共子序列_序列比对(二十四)——最长公共子序列
原创: hxj7 本文介绍如何求解两个字符串的最长公共子序列. 最长公共子序列问题 前文<序列比对(二十三)--最长公共子字符串>介绍了如何求解两个字符串的最长公共子字符串,本文将介绍如何 ...
- clustalw序列比对_序列比对(二)
Homology is the central concept for all of biology.--David Wake. Science, 1994 前言 正如前面引用的这句话,同源性是生物学 ...
- 【学习笔记】山东大学生物信息学-02 序列比较
课程地址:山东大学生物信息学 文章目录 二.序列比较 2.1 认识序列 2.2 序列相似性 2.3 替换记分矩阵 2.4 序列两两比较:打点法 2.5 序列两两比较:序列比对法(定量) 2.6 一致性 ...
- matlab中亚像素坐标位置,MATLAB+7.X生物信息工具箱的应用——序列比对(二)
MATLAB 7.X生物信息工具箱的应用--序列比对(二) 作者:李红燕, 刘新星, 谢建平, 杨英杰, LI Hong-yan, LIU Xin-xing, XIE Jian-ping , YANG ...
- python序列类型是二维元素向量吗_Python 二级选择题
88.下面代码的输出结果是 ( A ) print(round(0.1 + 0.2,1) == 0.3) A: True B: 0 C: 1 D: False 解释: round 是一个四舍五入的函数 ...
- DL之RNN:基于TF利用RNN实现简单的序列数据类型(DIY序列数据集)的二分类(线性序列随机序列)
DL之RNN:基于TF利用RNN实现简单的序列数据类型(DIY序列数据集)的二分类(线性序列&随机序列) 目录 序列数据类型&输出结果 设计思路 序列数据类型&输出结果 1.t ...
- 生物信息学 陈铭_后基因组时代生物信息学_陈铭.pdf
您所在位置:网站首页 > 海量文档  > 高等教育 > 生物学 后基因组时代生物信息学_陈铭.pdf6页 本文档一共被 ...
- 北京大学生物信息学 (4)序列数据库
北京大学生物信息学 (4)序列数据库 https://www.bilibili.com/video/BV13t411G7oh?p=9&spm_id_from=pageDriver 搜库算法 B ...
- 唐 库利超级计算机,第七卷 乖离性 百万亚瑟王_第二百五十二章 绝望中的希望...
第七卷 乖离性 百万亚瑟王_第二百五十二章 绝望中的希望 赫布里底训练大厅. "诸位,结果已经分析出来了,丘库林,也就是被你们捉到的闯入者,他身上的神装的确是断绝时代的遗物不错,而且,这件神 ...
最新文章
- 使用结构体数组统计男、女人数,计算全体学生的平均年龄、平均成绩,并将高于平均成绩的学生信息输出
- Autodesk MapGuide Enterprise 2011 Update 1 for Windows发布了
- java实现手机短信验证全过程
- vue2.0 #$emit,$on的使用
- Promise 原理解析与实现(遵循Promise/A+规范)
- select命名_Maya中Pymel写个带界面的重命名工具(一)
- 控制层SpringMVC和Struts2的区别
- QML Item定位器 Anchor
- 台式计算机颜色如何矫正,台式机怎么颜色校正操作教程
- matlab怎么设置步长,请教matlab中怎么对变步长的数据进行处理
- [Pytorch系列-25]:神经网络基础 - 单个无激活函数的神经元实现简单线性回归 - 2
- 软考系统集成项目管理工程师模拟题
- vue3 H5 pdf插件 iphone查看pdf失败
- 在pc电脑上使用地图(百度地图、高德地图等),地图软件是怎么获取pc电脑的所在位置的?
- Apple Watch使用指南:所有Apple Watch图标和符号含义
- Vue2学习笔记1 - win10下安装vue开发环境
- python入门教材 52pj_PJzhang:python基础入门的7个疗程-five
- 读书笔记:《编程之美》
- python结巴怎么安装pip_Python3.6 结巴分词安装和使用
- win10 安装redis 及启动命令