第4期 变异注解之旅

GeneDock聚道科技

为生命计算,助看病不难!

已关注

饭饼饼

Suranyi

等 20 人赞同了该文章

生信小白:肉哥,在第1期的介绍中,你讲了VCF文件,但我们只知道第17号染色体的43057065 上的一个T碱基突变成了G。除了这些信息我还想知道:这个位点是在某个基因上吗?这个突变有没有改变基因的功能呢?有没有影响转录和翻译?世界上有没有其他正常人的这个位点也变异了呢?如果有,是哪些人种呢?又是什么样的病例呢?……

(NEJM Illustrated Glossary)

西克孚肉:你想知道的太多了,但我有庞大“字典”库可以来为你解释。有了基因的变异信息后,我们可以去查字典(数据库),看看究竟这些词语表达什么意思,并标记下来。这个过程就叫做注释。

《水经注》:对《水经》的注解

Q:什么是变异注释

西克孚肉:

测序的过程产生了大量的遗传变异数据,其中只有少数变异具有功能影响。

变异注释的过程是使用各种变异信息的数据库对检出的变异进行注释,以便于对变异进一步筛选和解读。

注释可以大致分为:突变频率注释、突变相关的疾病注释和预测软件结果注释。注释可以大致分为:突变频率注释、突变相关的疾病注释和预测软件结果注释。

突变频率注释

人群频率数据库是遗传病诊断的重要参考工具,可以用于获取某变异在大规模人群中的发生频率。

ExAC

外显子组整合数据库,该数据库旨在汇总和协调各种大规模测序项目的外显子组测序数据,并为更广泛的科学界提供摘要数据。

dbSNP
NCBI下的一个很重要的数据库,由NCBI与人类基因组研究所(National Human Genome Research Institute)合作建立的,它是关于单核苷酸变异、插入删除多态性的资源库,包含了来自任何生物体的核苷酸序列。

1000 Genomes Project

千人基因组数据库目标是发现在人群中频率大于1%的变异位点,对来自不同人群的大量样本进行测序,识别到变异位点,包括了欧洲、美洲、亚洲的很多个不同的人种。

gnomAD

Broad研究所支持建立、各国研究人员共同协作建立的一个基因组突变频率数据库,目的是汇集和协调不同级别的大规模测序项目,包括全外显子与全基因组数据。目前有125,748个外显子数据和15,708个基因组数据。

突变相关的疾病注释

OMIM

在线人类孟德尔遗传信息数据库,包含了遗传性的基因疾病信息与表型信息。20世纪60年代由Victor Mckusick教授主编的《Mendelian inheritance in Man》,他一共从1966年到1998年发表了12本书,主要是他自己在收集。1985年创建联机形式,于是有了OMIM。

ClinVar

2013年创立,整合了dbSNP、dbVar、Pubmed、OMIM等多个数据库,将变异、临床表型、实证数据以及功能注解与分析等四个方面的信息,通过专家评审,逐步形成遗传变异-临床表型相关的数据库。

HGMD

人类基因突变数据库,目前包括240,269个变异,覆盖9976个基因。收集的突变包含了SNP、InDel、CNV、SV、基因重组等。相比ClinVar,HGMD包含了更多的基因和变异,并且每个季度进行更新,提供了最新、最全的变异信息。

预测软件结果注释

通过生物信息学相关算法(如SIFT,polyphen等),对变异进行功能危害性预测。预测和通路分析有助于发现潜在的新基因和位点。

值得注意的是,危害性预测值高的位点并不意味着一定致病。

生信小白:一个人类基因组包含近3500000个SNV突变和1000个拷贝数变异,其中有20000-25000个突变是落在蛋白编码区,在这2万多个突变当中有接近一半的突变改变了氨基酸,但仅有50-100个发生了蛋白截断或功能缺失。手动检查每个位点是非常耗时且不切实际!

西克孚肉:所以现在有很多注释工具,常用的有SnpEff、ANNOVAR 和 VEP等,这些工具是用算法的方式来注解这些突变的。

生信小白:原来你经常提的VEP是一个注释软件。

西克孚肉:对的,VEP是由国际三大数据库之一的Ensembl提供,基于perl语言。VEP可用于变异分析、注释和对编码、非编码区域的基因变异进行排序。

生信小白:有了工具就方便多了。但我注释了好多信息,眼睛不够用了啊。

别急,注释只是大海捞针的第一步,下次我们讲讲怎么捞针。

往期回顾:

第0期 生信分析是个什么玩意儿?

第1期 FASTQ! BAM! VCF! 傻傻分不清楚?

第2期 从FASTQ到BAM经历了什么?

第3期 变异类型知多少

发布于 2019-06-26

第4期 变异注解之旅相关推荐

  1. Android项目中创建编译期的注解

    ==注解 生命周期为RetentionPolicy.RUNTIME,可在运行时通过反射获取. 生命周期为RetentionPolicy.CLASS, 编译期处理的注解,可以使用APT(Annotati ...

  2. 从入门到精(fang)通(qi)第5期 我们的征途是星辰大海

    生物信息分析:从入门到精(fang)通(qi)第5期 我们的征途是星辰大海 GeneDock聚道科技 为生命计算,助看病不难! 已关注 19 人赞同了该文章 生信小白:震惊!一个全基因组会产生数百万个 ...

  3. 生物信息分析:从入门到精通结语

    生物信息分析:从入门到精(fang)通(qi)结语:入门生信一时爽,一直分析一直爽 GeneDock聚道科技 为生命计算,助看病不难! 已关注 王焕威 等 8 人赞同了该文章 生信小白:服务器.超算. ...

  4. Java注解 编译_Java注解(3)-注解处理器(编译期|RetentionPolicy.SOURCE)

    注解的处理除了可以在运行时通过反射机制处理外,还可以在编译期进行处理.在编译期处理注解时,会处理到不再产生新的源文件为止,之后再对所有源文件进行编译. Java5中提供了apt工具来进行编译期的注解处 ...

  5. Java注解编译期处理AbstractProcessor详解

    文章目录 概述 注解处理器 注解处理流程 AbstractProcessor getSupportedOptions() getSupportedAnnotationTypes getSupporte ...

  6. 玩转java(Android)注解

    2019独角兽企业重金招聘Python工程师标准>>> 玩转java(Android)注解 1. java标准(原生)注解概览 Java API 中,在java.lang.java. ...

  7. 好文转载——追求卓越之旅

    转自褪墨:http://www.mifengtd.cn/articles/mastery-journey.html 追求卓越之旅(Mastery Journey)是精通一项非天生技能的旅程,无论你的天 ...

  8. @data注解的作用_Java中注解学习系列教程-2

    在上一篇文章中,我们讲解了:Java中注解的定义.JDK中内置注解.第三方注解. 本文是注解系列教程中的第二篇.来看看今天主要内容: ​ 1:注解的分类 2:元注解说明 3:自定义注解声明 一:注解的 ...

  9. 如何获取注解中的值_如何在运行时利用注解信息

    注解( annontation )是 Java 1.5 之后引入的一个为程序添加元数据的功能.注解本身并不是魔法,只是在代码里添加了描述代码自身的信息,至于如何理解和使用这些信息,则需要专门的解析代码 ...

最新文章

  1. Nature调查 l 中国博士生们的科研围城
  2. matlab 二值化_MATLAB实验,图像二值化处理
  3. Android Stdio 插件谷歌兼容库Appcompat
  4. page 怎么把list 分页_自定义分页器的实现
  5. python爬虫入门(六) Scrapy框架之原理介绍
  6. 原创 MySQL探秘(八):基于Redo Log和Undo Log的MySQL崩溃恢复流程(一致性)
  7. java用map集合实现随机抽奖源码
  8. arm linux 存储,linux arm的存储分布那些事
  9. 在PHP中数组有两种形式区别,PHP三种数组合并方式区别示例
  10. netlify 部署vue_如何使用Netlify构建和部署网站-全面的教程
  11. idea解决编译时出现的未结束的字符文字等错误
  12. 企业信息化之“请纵向排队”
  13. celery英语_图文海涛英语 分类记单词第112天:中止cease天花板ceiling
  14. html网上购物系统界面,网上购物系统界面设计要点有哪些?设计思路是什么?...
  15. 数据库 sqlserver实现插入随机姓名性别民族
  16. 路由器显示DNS服务器异常,路由器dns异常怎么办
  17. 走进晶圆厂,深入了解芯片制造流程
  18. lav点搜网metro风格分享
  19. 《Biology,8th》Neil Campbell (1)
  20. 隐形降权是什么, 什么行为会导致店铺被隐形降权,如何避免降权

热门文章

  1. Mobile3DRecon:手机上的实时单眼3D重建
  2. CVPR 2021 Oral | 室内动态场景中的相机重定位
  3. 图像反光能被一键去除了?港科大开源RFC,仅用一个操作,强反光也能完美去除|CVPR2021...
  4. 论文翻译 | Mask-SLAM:基于语义分割掩模的鲁棒特征单目SLAM
  5. 求介绍matlab函数用法的书,MATLAB初学者教程--函数用法的简单介绍
  6. Matplotlib绘制指向点箭头
  7. Nat. Commun | 基于网络的药物组合预测
  8. Java文件的状态_java中文件的状态
  9. 共享可写节包含重定位_艾瑞咨询:2020年数说双11电商购物节报告
  10. 零基础入门学习Python(32)-丰富的else语句及简洁的with语句