第一步:下载Annovar

上Annovar官网下载(http://annovar.openbioinformatics.org/en/latest/user-guide/download/),现在要邮件注册后才能下载。邮件注册后会给你最新版软件下载地址,

下载后文件为annovar.latest.tar.gz。

第二步:安装Annovar

linux系统下用该命令解压

tar zxvf annovar.latest.tar.gz

解压后生成annovar文件夹,里面有6个perl脚本程序和两个文件夹,其中一个是example文件夹,另一个是已经建立好的hg19或者GRCh37的humandb的数据库文件夹,可用于人的注释。

第三步:使用Annovar

人的注释方法,官网介绍的很详细,但仅仅有人的数据库肯定是满足不了大家的需求。

下面以小鼠mm9为例子,介绍如何自己构建一个mousedb数据库。

先在annovar文件夹里面创建mousedb文件夹(名字可自取),命令

mkdir mousedb

然后使用annovar文件夹下的perl程序annotate_variation.pl

perl annotate_variation.pl -downdb -buildver mm9 -webfrom annovar refGene mousedb/

这个命令能实现的是帮忙下载mm9的refGene的文件,保存在mousedb文件下,自动解压后文件名为mm9_refGene.txt。

然后程序会提示使用以下两个命令继续建库

annotate_variation.pl --buildver mm9 --downdb seq mousedb/mm9_seq

retrieve_seq_from_fasta.pl mousedb/mm9_refGene.txt -seqdir mousedb/mm9_seq -format refGene -outfile mousedb/mm9_refGeneMrna.fa

同样在annovar文件下运行这两个perl程序

perl annotate_variation.pl --buildver mm9 --downdb seq mousedb/mm9_seq

通过这个命令,会在mousedb下创建文件夹mm9_seq,并且在里面下载mm9的基因组文件chromFa.tar.gz,perl程序帮忙解压后是按染色体分开的fasta格式文件。

然后继续运行perl程序

perl retrieve_seq_from_fasta.pl mousedb/mm9_refGene.txt -seqdir mousedb/mm9_seq -format refGene -outfile mousedb/mm9_refGeneMrna.fa

该程序会会在mousedb下创建mm9_refGeneMrna.fa文件,是根据mm9_refGene.txt的信息,重新构建成的老鼠转录表达基因fasta格式文件。

这样老鼠mm9 annovar gene based注释库就弄好了

以文本文件test.input为案例进行测试

生成test.input的txt格式文件,根据annovar官网介绍,只要这最基本的五列信息就可以进行注释,五列分别染色体名称,染色体上的位置,染色体上的位置,参考基因组碱基,变异碱基。

1       19215217        19215217        T       C
1       33803084        33803084        A       G
1       33803198        33803198        A       G
1       37499237        37499237        T       C
1       37499238        37499238        T       C
1       37500003        37500003        T       C
1       43826936        43826936        T       C
1       58853960        58853960        A       G
1       58854487        58854487        A       G
1       60436865        60436865        T       C

然后使用perl程序进行gene based的注释

perl annotate_variation.pl -out test -build mm9 test.input mousedb

注释后会生成test.variant_function,test.exonic_variant_function和test.log文件,前两个即为所需要的文件。用这个例子输出test.exonic_variant_function文件输出为空

文件,因为这些位点没有在exonic区域的,所以没有结果。如果有位点在exonic中,则在test.exonic_variant_function中会更具体的描述为同义突变还是非同义突变

intronic        Tfap2b  1       19215217        19215217        T       C
UTR3            Bag2    1       33803084        33803084        A       G
UTR3            Bag2    1       33803198        33803198        A       G
UTR3           Mgat4a  1       37499237        37499237        T       C
UTR3           Mgat4a  1       37499238        37499238        T       C
UTR3           Mgat4a  1       37500003        37500003        T       C
intronic        Uxs1    1       43826936        43826936        T       C
intronic        Casp8   1       58853960        58853960        A       G
intronic        Casp8   1       58854487        58854487        A       G
intronic        Cyp20a1 1       60436865        60436865        T       C

Annovar 软件注释流程介绍
http://www.omicshare.com/forum/thread-1782-1-180.html
(出处: OmicShare Forum)

Annovar 软件注释流程相关推荐

  1. Annovar 信息注释

    ANNOVAR 注释软件 ANNOVAR简介 ANNOVAR结构 ANNOVAR下载数据库 ANNOVAR输入格式 ANNOVAR格式转换 ANNOVAR注释功能 用table_annovar.pl进 ...

  2. pfamscan 的使用_蛋白编码能力预测软件pfam流程

    原标题:蛋白编码能力预测软件pfam流程 一.分析背景 蛋白一般由一个或多个功能域所组成,在不同蛋白质组合中出现的不同结构域导致了自然界中蛋白质复杂的多样性.鉴定一个蛋白中的结构域有助于更深入地理解蛋 ...

  3. other:软件开发流程

    软件开发流程 那要看你的项目经理是当成什么层面的了,如果是负责面向客户联络沟通,内部监督控制进度的话是能做好内外沟通,两边都能协调好就可以了.如果你要深入项目管理,那么肯定要熟悉整个软件开发项目的过程 ...

  4. 软件开发流程包含哪些内容

    2019独角兽企业重金招聘Python工程师标准>>> 能否开发出一个好的软件,关键是看软件开发前期所做的工作,重点是这个软件有没有一个好的 软件开发流程,因为一个好的软件开发流程关 ...

  5. rp软件app流程图_如何开发app软件,流程怎样

    好的APP开发公司有哪些 手机app开发分为Android客户端开发.iOS客户端开发.Symbian客户端开发.Windows Phone和BlackBerry OS等定制开发.如果找公司做的话,和 ...

  6. ue4导入倾斜摄影_倾斜摄影入门必学|Context Capture建模软件工作流程

    对于一个典型的 倾斜摄影入门必学|Context Capture建模软件工作流程​www.swqy3d.com 来讲,分为了如下几步:1 新建项目后导入照片.POS.点云等数据.①导入照片 ②当你新建 ...

  7. 软件开发模型_QT开发(二十三)——软件开发流程

    一.软件开发流程简介 软件开发流程是通过一系列步骤保证软件产品的顺利完成,是软件产品在生命周期内的管理学. 软件开发流程的本质是软件开发流程与具体技术无关,是开发团队必须遵守开的规则. 二.常见软件开 ...

  8. 软件有效期如何实现_如何实现软件本地化:软件本地化流程的十条守则

    唐能译牛:软件本地化,是指将软件产品的用户界面和辅助材料,从其原产国语言向另一种语言转化,使之适应某一外国语言和文化的过程.软件翻译和本地化是将软件产品推向全球市场的必要环节.唐能翻译提供的软件本地化 ...

  9. (6)Vivado软件开发流程(第2天)

    (6)Vivado软件开发流程(第2天) 1 文章目录 1)文章目录 2)FPGA初级课程介绍 3)FPGA初级课程架构 4)Vivado软件开发流程(第2天) 5)技术交流 6)参考资料 2 FPG ...

最新文章

  1. 提取so文件的特征值
  2. 剪刀、石头、布机器人比赛
  3. FPGA的发展历史及相关名词解释
  4. android 仿微信聊天气泡显示图片,实现仿照微信聊天气泡里显示图片效果的自定义View...
  5. mysql数据库英文句子翻译_MySQL文档翻译(八)附英文原文---性能优化概览
  6. java additem 错,Java错误:IllegalArgumentException:向容器添加窗口
  7. 在此之前的软件系统做开发—需求的研究框架
  8. setScaledContents的看法
  9. php全站文章搜索,Discuz X3.1全站文章全文检索的实现方法
  10. 解决windows安装mongodb出现dbexit: rc:100错误
  11. 【多媒体封装格式详解】---MKV【2】
  12. 《人类最美的54个公式》
  13. 宜人贷宜人蜂巢金融科技AI实践:蜂巢机器人
  14. 驾照考试之科目三(深圳东周版)
  15. php遵义旅游管理系统毕业设计源码091801
  16. 让我带你一起了解一下 ls -l 命令输出的内容都有哪些意义,以及文件权限如何调整
  17. 2020 用html jQuery实现广告轮播图自动切换 滚动页面 鼠标悬浮下标且左右切换图片
  18. 在HTML中禁止IE缓存
  19. html文件怎么打印没响应,打印机打印文件时显示未响应是怎么回事
  20. 【docker入门】

热门文章

  1. AMD Radeon 显卡设置无法打开(闪退)
  2. initramfs unpacking failed: Decoding failed 无法安装ubuntu 联想台式机
  3. 如何去掉word页眉上的横线
  4. C#中的 int?是什么意思
  5. 南京印象之新街口地铁站
  6. 搭建开源智能家居系统Domoticz
  7. mysql中的回表操作
  8. 其实特简单,1分钟爬取全国高校信息并制成大屏可视化
  9. 关于虚拟机无法创建目录的问题
  10. 当eclipse工程出现红色感叹号的解决方法