一般的,当我们使用BLAST(是一种用于在数据库当寻找任何蛋白质或者基因序列与你的目标序列一致的程序)时,我们会注意到这里有一个E值。那么这个Evalue是什么呢?怎么来理解这个值呢?

下面是一个平常的blast结果,

Sequences producing significantalignments: Score (S) E
gi|83574104|Moth_2374|sporulation –prote… 202 2e-53
gi|83573446|Moth_1696|Sporulation –prote… 112 1e-26
gi|83571874|Moth_0087|sporulation –prote… 95 3e-21
gi|83573435|Moth_1685|Substrate-binding -… 27 1.0

后面有两个值,一个是S值,一个E值。可以发现,结果是依据S值的高低来显示的。

S值表示两序列的同源性,分值越高表明它们之间相似的程度越大。
E值就是S值可靠性的评价。它表明在随机的情况下,其它序列与目标序列相似度要大于这条显示的序列的可能性。所以它的分值越低越好。
E值的计算:
E=Kmn(e-lambda*S)
其中,K和lambda与数据库和算法有关,是个常量;m代表目标序列的长度,n代表数据库的大小,S就是前面提到的S值。
通常来讲,我们认为E值小于10-5就是比较可性的S值结果。我们可以想象,相同的数据库,E=0.001时如果有1000条都有机会S值比现在这个要高的话,那么不E设置为10-6时可能就会只得到一条结果,就是S值最可靠的那个。

但是E值也不是万能的。它在以下几个情况下有局限性:

1. 当目标序列过小时,E值会偏大,因为无法得到较高的S值。
2. 当两序列同源性虽然高,但有较大的gap(空隙)时,S值会下降。这个时候gap scores就非常有用。
3. 有些序列的非功能区有较低的随机性时,可能会造成两序列较高的同源性。

BLAST试图去避免这些问题,但是还是应该自己有个清晰的概念。

E值总结:

E值适合于有一定长度,而且复杂度不能太低的序列。
当E值小于10-5时,表明两序列有较高的同源性,而不是因为计算错误。
当E值小于10-6时,表时两序列的同源性非常高,几乎没有必要再做确认。

BLAST中的E值的理解相关推荐

  1. blast中evalue和bitscore的理解

    blast中筛选结果时,blast会输出bitscore和evalue,原始打分,它们是重要的同源性考量指标,其含义对于数据的筛选有指导意义. 文章目录 bitscore 含义 evalue 含义 示 ...

  2. mysql null的作用_MySQL中对于NULL值的理解和使用教程

    NULL值的概念是造成SQL的新手的混淆的普遍原因,他们经常认为NULL是和一个空字符串''的一样的东西.不是这样的!例如,下列语句是完全不同的: ?12mysql>INSERT INTO my ...

  3. react中对于key值的理解

    1.key是用来帮助react识别哪些内容被更改.添加或者删除.key需要写在用数组渲染出来的元素内部,并且需要赋予其一个稳定的值.如果key值发生了变更,react则会触发UI的重渲染. 2.在相邻 ...

  4. BLAST中的E值(E-value)

    dotplot中提到的概念:E-value.表明在随机的情况下,其它序列与目标序列相似度要大于S值的可能性.所以它的分值越低越好. E值的计算:(某处公式为MEAN/SD,应该是不对的,说不通) E= ...

  5. 如何理解ANOVA中的F值与P值

    ANOVA(analysis of variance),方差分析,曾经以为它是一个多么复杂的简写... 一.理解F分布 要理解F分布,就要先理解卡方分布,要理解卡方分布,就要先理解正态分布. 1.正态 ...

  6. 如何理解CNN中的权值共享

    记录一下深度学习中CNN中的权值共享 首先,卷积网络的核心思想是将:局部感受野.权值共享(或者权值复制)以及时间或空间亚采样这三种结构思想结合起来获得了某种程度的位移.尺度.形变不变性. 通俗理解,所 ...

  7. 统计|假设检验中的P值(pvalue)如何看/怎样理解

    本博文源于<商务统计>,之前在做matlab编程和spss统计分析中,对p值的理解就是懵懵懂懂,无法确定出真正含义.今天就以新生儿的例子来观看p值是如何看的,并且了解假设检验的5个步骤. ...

  8. 理解C和C++中的左值和右值

    翻译至https://eli.thegreenplace.net/2011/12/15/understanding-lvalues-and-rvalues-in-c-and-c/ C/C++编程中不是 ...

  9. 理解C++中的左值和右值

    一.前言 一直以来,我都对C++中左值(lvalue)和右值(lvalue)的概念模糊不清.我认为是时候好好理解他们了,因为这些概念随着C++语言的进化变得越来越重要. 二.左值和右值--一个友好的定 ...

最新文章

  1. 10行Python代码实现Web自动化管控
  2. 最终一致性,一致只会迟到,但绝不会缺席
  3. ERROR: JVMPI, an experimental interface, is no longer supported.
  4. myeclipse 运行速度慢的解决方案
  5. 2018-11-02 在代码中进行中文命名实践的短期目标
  6. MPC(模型预测控制)之二(路径规划)
  7. git tag打标签常用命令
  8. LeetCode(221) Maximal Square
  9. 家庭记账本开发记录(4)
  10. 数字信号处理matlab——系统响应和系统稳定
  11. centos7安装google浏览器
  12. 找不到本地计算机策略组,Win10家庭版找不到本地组策略gpedit.msc解决办法
  13. 搜集ipv6 DNS服务器信息,IPV6 DNS服务器地址列表
  14. linux ln -sv命令,linux ln 命令详解
  15. 支持web信息分类的高性能蜘蛛程序 爬虫程序 spider
  16. Markdown语法学习|精简版
  17. 个人云盘、企业云盘傻傻分不清楚?3分钟带你清晰两者差异!...
  18. C++ 风格与技术 FAQ(中文版)
  19. AUTOSAR - WDGM认知过程(二):配置分析
  20. 笨方法学Python 习题21

热门文章

  1. 第三章 系统的时域分析
  2. 东文财 赵栋 罗松 201771010106《面向对象程序设计(java)》实验14
  3. spring的继承与依赖
  4. [Darktable]dt源码分析(未完)
  5. linux 移除用户所在的组,Linux用户及用户组添加和删除操作
  6. 找不到com.sun.beans.introspect.PropertyInfo的类文件问题
  7. C++STL容器总结
  8. 【Python_PyQtGraph 学习笔记(四)】基于PyQtGraph设置槽函数,实现保存图片到本地的功能
  9. fileinfo的作用以及如何开启fileinfo扩展
  10. select语句(3)--单值函数