GWAS数据分析流程—SNP、Indel注释
1、snpeff
1.1、snpeff软件下载
wget https://snpeff.blob.core.windows.net/versions/snpEff_latest_core.zipunzip snpEff_latest_core.zipcd snpEff
解压后即可使用。
1.2、在snpeff文件夹下新建一个命名为data的文件夹,data文件夹下面再新建一个要生成数据库的文件夹,命名为maize,在maize里面下载参考基因组序列和基因组的GTF文件,分别重命名为sequences.fa和genes.gtf。
1.3、定义snpEff.config文件,
vi snpEff.config打开snpEff.config文件,添加
# maize genome, version maizev5
maize.genome : maize
如图所示:
1.4、SNP、Indel注释
##SNP注释
java -Xmx4g -jar /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.jar -c /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.config -ud 2000 -csvStats maizesnp.csv -htmlStats maizesnp.html -o vcf maizev4 maize.snp.filed.vcf > maize.filtered.snp.ann.vcf ##indel注释
java -Xmx4g -jar /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.jar -c /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.config -ud 2000 -csvStats maizeindel.csv -htmlStats maizeindel.html -o vcf maizev4 maize.indel.filed.vcf > maize.filtered.indel.ann.vcf
2、annovar
2.1、软件安装
annovar下载地址Download ANNOVAR - ANNOVAR Documentation
解压后输出环境变量
export PATH=/ipm1/hang/pl/program/snp_indel_snpeff/annovar:$PATH
annovar的使用需要gtfToGenePred软件包
下载地址为:https://link.zhihu.com/?target=http%3A//hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/
下载后运行 chmod +x ./gtfToGenePred 增加运行权限
2.2、将GTF文件转换成refGene格式
gtfToGenePred -genePredExt -ignoreGroupsWithoutExons genes.gtf maize_refGene.txt
2.3、建立注释库
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/retrieve_seq_from_fasta.pl --format refGene --seqfile sequences.fa maize_refGene.txt --out maize_refGeneMrna.fa
2.4、将VCF文件转换成表格格式输入文件
##SNP
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/convert2annovar.pl -format vcf4 -allsample -withfreq maize.snp.filed.vcf > maize.snp.vcf.annovar.input##Indel
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/convert2annovar.pl -format vcf4 -allsample -withfreq maize.indel.filed.vcf > maize.indel.vcf.annovar.input
2.5、SNP、Indel注释
##SNP注释
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/annotate_variation.pl -geneanno --neargene 2000 -buildver maize -dbtype refGene -outfile maizesnp.anno -exonsort maize.snp.vcf.annovar.input ./##indel注释
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/annotate_variation.pl -geneanno --neargene 2000 -buildver maize -dbtype refGene -outfile maizeindel.anno -exonsort maize.indel.vcf.annovar.input ./
2.6、统计变异信息、查看变异类型等
less -S maizesnp.anno.variant_function |cut -f 1|sed 's/;/\n/g' |sort | uniq -cless -S maizeindel.anno.variant_function |cut -f 1|sed 's/;/\n/g' |sort | uniq -c
GWAS数据分析流程—SNP、Indel注释相关推荐
- GWAS数据分析流程—SNP、Indel提取
1.测序质量评估 ## conda安装fastqc fastqc *.fastq.gz -t 8 -o fastqc_out/可选(合并质控报告) ## conda安装multiqc (可能会要求安装 ...
- GWAS数据分析专题
欢迎关注"生信修炼手册"! 全基因组关联分析是目前研究复杂疾病易感性的最有效手段之一,通过芯片或者高通量测序得到全基因组规模的SNP分析结果,再结合卡方,费舍尔精确检验,线性回归等 ...
- 【Sentieon】PacBio HiFi三代测序数据SNP/Indel加速分析
Sentieon软件在二代测序中SNP/Indel变异检测流程已非常成熟,并以其检测准确性高和检测速度快而广受业内人士认可.近日,Sentieon推出了DNAscope LongReads分析流程,深 ...
- R语言实现GWAS结果显著SNP位点归类提取与变异类型转化
GWAS结果显著SNP位点归类提取与变异类型转化 根据GWAS得到的Rresult文件信息,能够找出每个snp位点对应的显著性情况和基因变异信息,接下来,需要根据表格中的信息进行归纳总结,对不同显著性 ...
- GWAS分析中SNP解释百分比PVE | 第二篇,GLM模型中如何计算PVE?
上一篇,介绍了一下显著性的SNP,他们的解释表型变异百分比(PVE)之和,为何可能大于1. https://yijiaobani.blog.csdn.net/article/details/12209 ...
- GWAS分析中SNP解释百分比PVE | 第四篇,MLM模型中如何手动计算PVE?
系列部分: GWAS分析中SNP解释百分比PVE | 第一篇,SNP解释百分比之和为何大于1? GWAS分析中SNP解释百分比PVE | 第二篇,GLM模型中如何计算PVE? GWAS分析中SNP解释 ...
- 扩增子和宏基因组数据分析流程和可视化方案—刘永鑫(南京,2020年11月27日)
感谢中科院南京土壤所褚海燕老师的邀请,参加微生物生态与生物信息技术培训. 本次会议预计300人规模的会议,结果现场来了超千人.即使会议进行至第二天下午接近尾声,依然火爆如下: 我将本次90分钟报告&l ...
- 扩增子和宏基因组数据分析流程和可视化方案—刘永鑫(南京,2020年10月27日)
生物信息学习的正确姿势 NGS系列文章包括NGS基础.高颜值在线绘图和分析.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流 ...
- QIIME 2:可重复、交互和扩展的微生物组数据分析流程
文章目录 QIIME2:可重复.可交互.适用范围广和可扩展的微生物组数据科学 摘要 正文 图1. 交互式可视化工具 图2. 迭代记录数据来源确保分析可重复 代码可用 在线方法 提取QIIME2的存档内 ...
最新文章
- Linux下VS Code中C/C++开发环境的includePath设置
- extjs5的grid垂直滚动条bug_ExtJS 6.2.1 Classic Grid 滚动条bug解决方案
- [资源]推荐一些Python书籍和教程,入门和进阶的都有!
- Leetcode每日一题:136.single-number(只出现一次的数字)
- 格式化代码 Intellij IDEA
- 【光学】基于Matlab模拟衍射光栅实验
- SpringBoot构建电商基础秒杀项目
- rl滤波器原理_RL低通滤波器的原理是什么
- 2022年全球市场燃油液位传感器总体规模、主要生产商、主要地区、产品和应用细分研究报告
- Karl Guttag:谈MicroLED AR光学难点,Mojo Vision还有很多问题
- Unable to find the VMX binary ‘D:\新建文件夹1\vmware-vmx.exe‘.
- 微信小程序|SSM实现培训机构管理系统
- C语言练习,计算圆的面积和周长。
- 第三方app受陷,Atlassian 数据被盗
- IGMPv1包结构及工作机制讲解
- clap与slap_slap-slap和clap有什么区别?slap和c – 手机爱问
- android 浏览器 遥控器 光标,Unified Remote!让手机变身电视遥控器
- 百度计算广告学沙龙学习笔记 - 品牌展示广告
- 如何知道该不该接受创业公司的工作?
- 上架应用后google map不显示
热门文章
- vue导出excel乱码(锟斤拷唷?锟?;锟斤拷)
- 基于PHP+MySQL的图书馆图书借阅系统
- 网络营销:如何进行H5活动宣传?
- POJ 3322 Bloxorz I
- [省选前题目整理][清橙A1303]tree(LCT)
- 《NVMe-over-Fabrics-1_0a-2018.07.23-Ratified》阅读笔记(4)-- Controller Architecture
- 多旋翼无人机ROSC++开发例程(一):环境配置
- android 系统输入法显示与隐藏监听
- html做表格(个人简历)
- 【C++】关于日期的计算