• 5.3 寻找远缘相关蛋白质:位置特异性迭代BLAST(PSI-BLAST)和DELTA-BLAST
    • PAM250矩阵给探测远缘相关蛋白质提供了一个更好的打分系统,可以改变打分矩阵来检测远缘蛋白质,但仍然有局限性:

      • BLASTP检测到匹配蛋白,但是否同源并不明确。
    • PSI-BLAST

      • 更深入地搜索数据库,以发现一个与你感兴趣地蛋白远缘相关的匹配蛋白。
      • 比对的5个步骤:

        • 使用某个打分矩阵对查询序列在一个目标数据库中进行搜索(同常规BLASTP)
        • 基于成分的统计数据从起始搜索的结果中构建一个多序列比对,基于该多序列比对,构建专门的、个体化的搜索矩阵(或者叫谱profile)
        • 得到的位置特异性打分矩阵(PSSM)会被用来进行再一次搜索
        • PSI-BLAST对数据库匹配的统计显著性进行评估。
        • 以上搜索被重复迭代,一般迭代五次。
        • 图例:得到的位置特异性打分矩阵(PSSM)

        • 图例:3次迭代后的比对结果

      • PSI-BLAST的错误:污染问题

        • 错误的主要来源于无关序列的虚假扩增,有三种措施阻止污染

          • 1.使用过滤算法来去除由组成偏好性的氨基酸区域
          • 2.将入选阈值从默认值调整为一个较低的值
          • 3.肉眼检查每一次PSI-BLAST迭代的结果
          • 图示:所有的球蛋白及PSI-BLAST如何提升搜索灵敏度

      • 反向位置特异性BLAST(RPS-BLAST)

        • RPS-BLAST可以把一个查询蛋白序列与一个预先定义好的PSSM数据库进行比对,可鉴别查询序列中保守的蛋白质结构域。

          • 图示:RPS-BLAST查询

    • DELTA-BLAST

      • NCBI上最灵敏和准确的蛋白质搜索工具
      • 优势

        • 基于质量高的人工审核的CDD数据库,可以产生比PSI-BLAST更大、更完整的PSSM。
        • 比BLASTP和PSI-BLAST更加灵敏,包括可更灵敏地搜索远缘相关蛋白
        • 速度快
        • 比BLASTP得到的序列比对质量更好。
    • PSI-BLAST和DELTA-BLAST的性能评估

      • DELTA-BLAST灵敏度由于PSI-BLAST、BLASTP和其他程序;
      • 在给定数量的假阳性条件下,DELTA-BLAST可以发现三倍于BLASTP所发现的同源蛋白质
    • 模式匹配发起的BLAST(PHI-BLAST,模式识别BLAST)

      • 某个蛋白可能包含了某个氨基酸残基模式或者“特征信号”氨基酸残基,这可以帮助我们判断该蛋白质属于某个家族。PHI-BLAST可查找到既包含匹配模式又与查询序列相关的匹配结果;DELTA-BLAST灵敏性高,但它不会输出关于用户所选的模式的相关信息。
      • 特征信号和模式的定义

        • 自定义,并引入一定程度的模糊度,比如NDFX(5)GXW[YF]:

          • X(5)代表这五个位置上可以是任意一种氨基酸残基;
          • [YF]表明最后一个位置上的氨基酸残基必须是络氨酸或者苯丙氨酸中的一个;
          • 所选择的模式不能出现地太频繁,算法只允许出现频率小于1/5000.
      • 图示:选择一个模式进行PHI-BLAST搜索

      • PHI-BLAST算法根据跨越输入模式和其上下游的A1区域和A2区域得到的双序列比对A0进行分析,该序列比对结果利用有空位的延伸进行打分。
  • 欢迎加群交流,或者加VX:bbplayer2021,邀请进群

2021.11.21【读书笔记】丨生物信息学与功能基因组学(第五章 高级数据库搜索 中 )相关推荐

  1. 2020.11.3【读书笔记】丨生物信息学与功能基因组学(第二章 序列数据的获取 下)

    2.7 基因组浏览器 三个主流基因组浏览器:Ensemble.UCSC和NCBI 基因组组装 定义: 所获得的一个物种DNA序列按照染色体的形式进行的一种组装. 内容: 对基因组的注释,如起止位点.外 ...

  2. 2021.12.19【读书笔记】丨生物信息学与功能基因组学(第五章 高级数据库搜索 下)

    5.5 用类似于BLAST的比对工具快速搜索基因组DNA 需求:随着基因组DNA数据库数量增长,对比对工具要求越来越高 能在基因组DNA中找到外显子 比对时考虑基因组DNA包含的测序错误 有相应的算法 ...

  3. 读书笔记:《流畅的Python》第五章 一等函数

    # 一等对象/一等函数 ''' 1.在运行时创建 2.能赋值给变量或数据结构中的元素 3.能作为函数的参数传给函数 4.能作为函数的返回值返回结果 '''# 函数对象本身时function对象的实例d ...

  4. 2021.11.22【读书笔记】丨生物信息学与功能基因组学(第五章第五节 用类似于BLAST的比对工具快速搜索基因组DNA)

    5.5 用类似于BLAST的比对工具快速搜索基因组DNA 需求:随着基因组DNA数据库数量增长,对比对工具要求越来越高 能在基因组DNA中找到外显子 比对时考虑基因组DNA包含的测序错误 有相应的算法 ...

  5. 2022.01.23【读书笔记】丨生物信息学与功能基因组学(第六章 多重序列比对 上)

    学习目标 理解使用ClustalW进行多重序列比对(MSA)的三个主要阶段: 描述几种其他的多重序列比对(MSA)程序,了解他们的工作原理,比对它们与ClustalW的异同: 理解进行基准研究的重要性 ...

  6. 【读书笔记】《深入浅出nodejs》第五章 内存控制

    海量请求+长时间运行 -> 内存控制 -> 一切资源高效循环利用 1. V8的垃圾回收机制与内存限制 在Node中通过JavaScript使用内存时,只能使用部分内存(64位系统下约1.4 ...

  7. 尚硅谷——谷粒商城项目开发记录——2021.11.21

    尚硅谷--谷粒商城项目开发记录--2021.11.21 概念: 1.var和let的区别: 作用域: var 声明的变量往往会越域 let 声明的变量有严格局部作用域 声明次数: var 可以声明多次 ...

  8. 读书笔记——《深入理解计算机系统》第三章_程序的机器级表示(一)

    前言:已经大四,没有去找工作,选择了保研,之所以这样选择,有三个原因,一.刚进校时,听说保研都是牛人才能行的事,所以一心努力保研:二.2008年开始,经济危机比较严重,工作不好找,虽然软件专业要找一份 ...

  9. 读书笔记之《深入理解Java虚拟机:JVM高级特性与最佳实践》

    本篇带来的是周志明老师编写的<深入理解Java虚拟机:JVM高级特性与最佳实践>,十分硬核! 全书共分为 5 部分,围绕内存管理.执行子系统.程序编译与优化.高效并发等核心主题对JVM进行 ...

最新文章

  1. 零基础学python培训需要学习多久?
  2. vscode 远程linux 服务器开发
  3. 一、nginx基本模块以及模块配置
  4. 【深夜思考】转行学java找不到工作
  5. 抽象数据类型Triplet的C语言实现
  6. 【LeetCode从零单排】No88.Merge Sorted Array
  7. java pgp_Java相当好的隐私(PGP)
  8. [css] 标签、class和id选择器三者的区别是什么?分别在什么时候用?
  9. 大数据学习笔记:HBase Shell操作
  10. 配置svn支持http协议访问
  11. 【2020团体程序设计天梯赛】L2部分(PTA,L2-033到L2-036)题解代码复盘
  12. 跨时代比较:工业化因素是关键
  13. Microsoft Office Visio 2007和Microsoft Office Project 2007下载
  14. 获取p12证书详情,返回证书详情实体
  15. 罗技鼠标的蓝牙适配器无效的解决办法
  16. 恶心的极速输入法windows10 删除
  17. android 6.0权限 郭霖,Permission——郭霖认为最优的运行时权限方案
  18. 画板数据保存成文件的两种方法小结
  19. RabbitMQ之交换机
  20. chrome中文方框linux,问:Linux下Chrome标题栏中文乱码

热门文章

  1. BZOJ 4872 六省联考2017 分手是祝愿
  2. 蓝桥冲刺31天之316
  3. OnlyOffice配置文档
  4. 超可爱的颜文字,我要放到代码里❛‿˂̵✧
  5. 在Android上使用libgdx-box2d物理引擎
  6. 蓝桥杯历届试题——核桃的数量(LCM+GCD)
  7. 人去世以后京牌车怎么验车?京牌车还能过户吗?
  8. XStream转换器: 处理xml节点中既有属性又有值
  9. 《机器人爱好者(第3辑)》——与超级电脑比翼齐飞的游戏机
  10. 基于I-MX287A的mqtt远程控制ARM板上LED灯小项目总结