1、snpeff

1.1、snpeff软件下载

wget https://snpeff.blob.core.windows.net/versions/snpEff_latest_core.zipunzip snpEff_latest_core.zipcd snpEff

解压后即可使用。

1.2、在snpeff文件夹下新建一个命名为data的文件夹,data文件夹下面再新建一个要生成数据库的文件夹,命名为maize,在maize里面下载参考基因组序列和基因组的GTF文件,分别重命名为sequences.fa和genes.gtf。

1.3、定义snpEff.config文件,

vi snpEff.config打开snpEff.config文件,添加

# maize genome, version maizev5
maize.genome : maize

如图所示:

1.4、SNP、Indel注释

##SNP注释
java -Xmx4g -jar  /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.jar -c  /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.config -ud 2000 -csvStats maizesnp.csv -htmlStats maizesnp.html -o vcf  maizev4  maize.snp.filed.vcf > maize.filtered.snp.ann.vcf  ##indel注释
java -Xmx4g -jar  /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.jar -c  /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.config -ud 2000 -csvStats maizeindel.csv -htmlStats maizeindel.html -o vcf  maizev4   maize.indel.filed.vcf > maize.filtered.indel.ann.vcf

2、annovar

2.1、软件安装

annovar下载地址Download ANNOVAR - ANNOVAR Documentation

解压后输出环境变量

export PATH=/ipm1/hang/pl/program/snp_indel_snpeff/annovar:$PATH

annovar的使用需要gtfToGenePred软件包

下载地址为:https://link.zhihu.com/?target=http%3A//hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/

下载后运行 chmod +x ./gtfToGenePred 增加运行权限

2.2、将GTF文件转换成refGene格式

gtfToGenePred -genePredExt -ignoreGroupsWithoutExons  genes.gtf  maize_refGene.txt

2.3、建立注释库

/ipm1/hang/pl/program/snp_indel_snpeff/annovar/retrieve_seq_from_fasta.pl --format refGene --seqfile sequences.fa maize_refGene.txt --out maize_refGeneMrna.fa

2.4、将VCF文件转换成表格格式输入文件

##SNP
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/convert2annovar.pl -format vcf4 -allsample -withfreq maize.snp.filed.vcf > maize.snp.vcf.annovar.input##Indel
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/convert2annovar.pl -format vcf4 -allsample -withfreq maize.indel.filed.vcf > maize.indel.vcf.annovar.input

2.5、SNP、Indel注释

##SNP注释
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/annotate_variation.pl -geneanno --neargene 2000 -buildver maize  -dbtype refGene -outfile maizesnp.anno -exonsort maize.snp.vcf.annovar.input ./##indel注释
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/annotate_variation.pl -geneanno --neargene 2000 -buildver maize  -dbtype refGene -outfile maizeindel.anno -exonsort maize.indel.vcf.annovar.input ./

2.6、统计变异信息、查看变异类型等

less -S maizesnp.anno.variant_function |cut -f 1|sed 's/;/\n/g' |sort | uniq -cless -S maizeindel.anno.variant_function |cut -f 1|sed 's/;/\n/g' |sort | uniq -c

GWAS数据分析流程—SNP、Indel注释相关推荐

  1. GWAS数据分析流程—SNP、Indel提取

    1.测序质量评估 ## conda安装fastqc fastqc *.fastq.gz -t 8 -o fastqc_out/可选(合并质控报告) ## conda安装multiqc (可能会要求安装 ...

  2. GWAS数据分析专题

    欢迎关注"生信修炼手册"! 全基因组关联分析是目前研究复杂疾病易感性的最有效手段之一,通过芯片或者高通量测序得到全基因组规模的SNP分析结果,再结合卡方,费舍尔精确检验,线性回归等 ...

  3. 【Sentieon】PacBio HiFi三代测序数据SNP/Indel加速分析

    Sentieon软件在二代测序中SNP/Indel变异检测流程已非常成熟,并以其检测准确性高和检测速度快而广受业内人士认可.近日,Sentieon推出了DNAscope LongReads分析流程,深 ...

  4. R语言实现GWAS结果显著SNP位点归类提取与变异类型转化

    GWAS结果显著SNP位点归类提取与变异类型转化 根据GWAS得到的Rresult文件信息,能够找出每个snp位点对应的显著性情况和基因变异信息,接下来,需要根据表格中的信息进行归纳总结,对不同显著性 ...

  5. GWAS分析中SNP解释百分比PVE | 第二篇,GLM模型中如何计算PVE?

    上一篇,介绍了一下显著性的SNP,他们的解释表型变异百分比(PVE)之和,为何可能大于1. https://yijiaobani.blog.csdn.net/article/details/12209 ...

  6. GWAS分析中SNP解释百分比PVE | 第四篇,MLM模型中如何手动计算PVE?

    系列部分: GWAS分析中SNP解释百分比PVE | 第一篇,SNP解释百分比之和为何大于1? GWAS分析中SNP解释百分比PVE | 第二篇,GLM模型中如何计算PVE? GWAS分析中SNP解释 ...

  7. 扩增子和宏基因组数据分析流程和可视化方案—刘永鑫(南京,2020年11月27日)

    感谢中科院南京土壤所褚海燕老师的邀请,参加微生物生态与生物信息技术培训. 本次会议预计300人规模的会议,结果现场来了超千人.即使会议进行至第二天下午接近尾声,依然火爆如下: 我将本次90分钟报告&l ...

  8. 扩增子和宏基因组数据分析流程和可视化方案—刘永鑫(南京,2020年10月27日)

    生物信息学习的正确姿势 NGS系列文章包括NGS基础.高颜值在线绘图和分析.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流 ...

  9. QIIME 2:可重复、交互和扩展的微生物组数据分析流程

    文章目录 QIIME2:可重复.可交互.适用范围广和可扩展的微生物组数据科学 摘要 正文 图1. 交互式可视化工具 图2. 迭代记录数据来源确保分析可重复 代码可用 在线方法 提取QIIME2的存档内 ...

最新文章

  1. Linux下VS Code中C/C++开发环境的includePath设置
  2. extjs5的grid垂直滚动条bug_ExtJS 6.2.1 Classic Grid 滚动条bug解决方案
  3. [资源]推荐一些Python书籍和教程,入门和进阶的都有!
  4. Leetcode每日一题:136.single-number(只出现一次的数字)
  5. 格式化代码 Intellij IDEA
  6. 【光学】基于Matlab模拟衍射光栅实验
  7. SpringBoot构建电商基础秒杀项目
  8. rl滤波器原理_RL低通滤波器的原理是什么
  9. 2022年全球市场燃油液位传感器总体规模、主要生产商、主要地区、产品和应用细分研究报告
  10. Karl Guttag:谈MicroLED AR光学难点,Mojo Vision还有很多问题
  11. Unable to find the VMX binary ‘D:\新建文件夹1\vmware-vmx.exe‘.
  12. 微信小程序|SSM实现培训机构管理系统
  13. C语言练习,计算圆的面积和周长。
  14. 第三方app受陷,Atlassian 数据被盗
  15. IGMPv1包结构及工作机制讲解
  16. clap与slap_slap-slap和clap有什么区别?slap和c – 手机爱问
  17. android 浏览器 遥控器 光标,Unified Remote!让手机变身电视遥控器
  18. 百度计算广告学沙龙学习笔记 - 品牌展示广告
  19. 如何知道该不该接受创业公司的工作?
  20. 上架应用后google map不显示

热门文章

  1. vue导出excel乱码(锟斤拷唷?锟?;锟斤拷)
  2. 基于PHP+MySQL的图书馆图书借阅系统
  3. 网络营销:如何进行H5活动宣传?
  4. POJ 3322 Bloxorz I
  5. [省选前题目整理][清橙A1303]tree(LCT)
  6. 《NVMe-over-Fabrics-1_0a-2018.07.23-Ratified》阅读笔记(4)-- Controller Architecture
  7. 多旋翼无人机ROSC++开发例程(一):环境配置
  8. android 系统输入法显示与隐藏监听
  9. html做表格(个人简历)
  10. 【C++】关于日期的计算