生信笔记:E值究竟是什么?!!!
先来看E值的计算公式:
E=kmne−λSE=kmne^{- \lambda S} E=kmne−λS
k,λk, \lambdak,λ 是两个修正参数,与数据库和算法有关,用来平衡不同打分矩阵和搜索空间对搜索结果的影响(The parameters K and λ represent natural scales for the search space and the scoring system respectively.)
mmm:目标序列长度
nnn:数据库总残基数
SSS:得分
再来看NCBI中对E值的定义:
The Expect value (E) is a parameter that describes the number of hits one can “expect” to see by chance when searching a database of a particular size. It decreases exponentially as the Score (S) of the match increases. Essentially, the E value describes the random background noise. For example, an E value of 1 assigned to a hit can be interpreted as meaning that in a database of the current size one might expect to see 1 match with a similar score simply by chance.
期望值(E)是一个参数,它描述在搜索特定大小的数据库时偶然可以“期望”看到的hit数量。 随着分数(S)的增加,它呈指数下降。 本质上,E值描述了随机背景噪声。 例如,某个hit的E值为1可以解释为:在当前大小的数据库中,在随机的情况下,偶然出现的匹配结果数为1。
生信笔记:E值究竟是什么?!!!相关推荐
- linux在生信的作用,【生信笔记】右键菜单打开WSL功能方法简介
在人工智能以及生物信息学发展迅速的现在,充分掌握相关技术是非常重要的,而由于系统的差异,导致很多软件需要在Linux或者Mac OS上运行,长期以来,在Windows系统上解决这一难题的方式是安装虚拟 ...
- 生信笔记 | 探索PubMed数据库文献
第一个问题:研究最热门的基因是什么 在NCBI的ftp里面关于人的一些基因信息, 在 :ftp://ftp.ncbi.nlm.nih.gov//gene 下载即可! 其中 gene2pubmed.gz ...
- 【生信笔记】python实现DNA反向互补序列的6种方法
文章目录 1 写在前面的絮絮叨叨 2 反向序列函数 3 互补序列函数 互补序列方法1:用字典dictionary 互补序列方法2:python3 translate()方法 互补序列方法3:最原始方法 ...
- 生信笔记 | 文本挖掘的一般流程
一.文本挖掘的一般过程 参考: http://www.sthda.com/english/wiki/text-mining-and-word-cloud-fundamentals-in-r-5-sim ...
- 生信笔记:系统进化树的分类
这是一篇阅读笔记,原文刊载于Digital Atlas of Ancient Life网站.原文链接 建立系统进化树的意义 由于林奈氏分类法出现于进化的概念没有被广泛接受的年代,所以系统发育分析可以用 ...
- 生信笔记 | 自定义GSEA分析中的gmt格式文件
在GSEA分析中,在MSigDB(Molecular Signatures Database)数据库中定义了很多基因集,下载的基因集是gmt格式文件.下载的gmt格式文件,打开后可以看见是下面这个样子 ...
- edger多组差异性分析_简单使用DESeq2/EdgeR做差异分析 – 生信笔记
DESeq2和EdgeR都可用于做基因差异表达分析,主要也是用于RNA-Seq数据,同样也可以处理类似的ChIP-Seq,shRNA以及质谱数据. 这两个都属于R包,其相同点在于都是对count da ...
- Bioinfo:学习Python,做生信PartII 学习笔记
在学习了生信大神孟浩巍的知乎Live "学习Python, 做生信"之后,对第二部分的文件信息处理部分整理了如下的笔记. 一.fasta与fastq格式的转换 1.首先需要了解FA ...
- 生存曲线 p值 python_超详细讲解生信SCI中的生存曲线作图,不看后悔系列
原标题:超详细讲解生信SCI中的生存曲线作图,不看后悔系列 在线及个性化精美Kaplan-Meier生存曲线的绘制 大家好,我是阿琛.俗话说,是骡子是马拉出来溜溜.在肿瘤研究中,一个基因的研究价值高不 ...
最新文章
- NC19814最短路 LCA+bfs暴力
- 微信订阅号开发笔记(三)
- 正确解读PHP获取时间错误原因
- 牛客 - Shortest Common Non-Subsequence(dp+序列自动机)
- 看懂别人的代码,只是成为高效程序员的第一步!
- php geteditor,wordpress函数get_editor_stylesheets()用法示例
- 力扣26,删除重复项(JavaScript)
- python开始_python开始的一天
- 智慧工厂应用系统建设方案
- java同步异步的区别
- 关于数据库字段模糊查询
- python+tkinter实现绘图板
- 淘宝API item_search_similar - 搜索相似的商品
- 什么叫Jour-fix
- 【号外】联手腾讯故宫试水“互联网+”
- UOS系统适配-常用开发工具安装
- 企业邮箱价格多少钱?邮箱购买价格多少钱?
- Sallen-Key 有源滤波器-ONE
- 游戏感:虚拟感觉的游戏设计师指南——第十五章 超级马里奥64
- C#-飞行棋小游戏的前识 067