Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean
中文名:基于GWAS与群体进化分析挖掘大豆驯化及改良相关基因

发表期刊杂志:nature biotechnology
影响因子:41.514
发表时间:2015年2月
发表单位:中科院遗传与发育生物学研究所

一、      研究取材
62株野生大豆、130株地方种和110个驯化品种构建的一个自然群体

二、      方法流程
Illumina HiSeq 2000 测序平台,测序文库300bp,样本平均测序深度达到11X

三、      生物信息学分析
群体结构分析、选择清除分析、重要性状的全基因组关联分析

四、      研究结果
1)使用BWA软件将原始数据与参考基因组进行比对,使用samtools将sam格式转化为bam,使用picard软件去掉Duplicated reads。

2)SNP calling使用GATK和samtools,取两者结果的交集。对于GATK参数设置:-stand_call_conf 30。MAF设置为0.01。

3) Indel calling类似于SNP calling,使用GATK的UnifiedGenotyper程序,起参数设置为-glm INDEL,只考虑6bp范围内的缺失和插入。

4)SNP注释使用的软件为ANNOVAR。SNP被注释到内含子(overlap- ping with an intron)、外显子、基因间区,可变剪切位点(within 2 bp of a splicing junction)、5′UTRs 、3′UTRs,, upstream and downstream regions (within a 1 kb region upstream or downstream from the transcription start site).注释在外显子区域的SNP又分为同义和非同义突变。注释到外显子的Indel又分为移码突变和非移码突变。

5)群体结构分析中,PCA使用的是EIGENSOFT 4.2 的smartpca 程序,neighbor-joining tree 使用PHYLIP 3.68软件。结构分层使用FRAPPE,其中k值选取2到7.连锁不平衡分析使用plink软件。关联分析使用的GAPIT 分析软件。

转载于:https://www.cnblogs.com/zkkaka/p/6149686.html

【GWAS文献】基于GWAS与群体进化分析挖掘大豆相关基因相关推荐

  1. 基于多模态成像遗传学数据来预测帕金森病相关基因和大脑区域的新型CERNNE方法

    系列文章目录 基于聚类演化随机森林的阿尔兹海默症的多模态数据分析 基于多模态成像遗传学数据来预测帕金森病相关基因和大脑区域的新型CERNNE方法 系列文章目录 前言 阅览文章之前记得一键三联哦,做文章 ...

  2. 二代测序群体进化-GWAS分析及案例解析

    群体进化-gwas分析 群体进化基础分析 PCA 分析原理 PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法.PCA的主要思想是将n ...

  3. GWAS | 原理和流程 | 全基因组关联分析 | Linkage disequilibrium (LD)连锁不平衡 | 曼哈顿图 Manhattan_plot | QQ_plot |...

    问题: linkage disequilibrium (LD)和 pairwise correlation的区别?似乎它们都能达到相同的目的. 先从直觉上理解一下GWAS的原理: 核心就是SNP与表型 ...

  4. 重测序群体遗传进化分析之进化树构建

    tree 重测序大家都不陌生,它是检测样本基因组变异(SNP,indel,SV,CNV)的主要手段之一,有了这些变异信息,后续可以做很多分析工作,例如: 遗传群体可以进行遗传图谱构建.BSA分析等:大 ...

  5. 群体进化技术原理和研究思路

    学习链接 https://www.bilibili.com/video/BV11X4y1G7ZM/?spm_id_from=333.788.recommend_more_video.10 不同生存条件 ...

  6. 文献解读丨利用群体转录组方法和eQTLs寻找水稻抗病转录因子

    最近在学习一篇群体转录组和eQTLs相关的文献,做一个简单的笔记.该论文分析了287份材料的转录组数据,并在一个远端eQTL调控热点中鉴定到一个关键转录因子,它能够激活下游抗毒素合成相关基因的表达,从 ...

  7. 有源淹没分析arcgis_基于ArcGIS的洪水淹没分析与三维模拟

    基于 ArcGIS 的洪水淹没分析与三维模拟 孙 君 , 奚赛英 , 尤 迪 , 郑付涛 [摘 要] 摘 要 : 洪水淹没范围的确定是洪灾损失评估和防洪决策的核心环节 . 基 于 TIN 数据 , 运 ...

  8. 子空间迭代法 matlab,基于MATLAB的一类迭代分析

    一般的计算方法教程如文献[1-5]都会介绍三种常见的迭代法,即Jacobi方法.Gauss-Seidel方法和SOR迭代.由于Gauss-Seidel方法充分利用了迭代过程的新信息[1,2],一般来说 ...

  9. 网站数据分析:基于用户细分的比较分析

    从网站的用户层面,我们根据用户访问的行为特征将用户细分成各种类型,因为用户行为各异,行为统计指标各异,分析的角度各异,所以如果要对用户做细 分,可以从很多角度根据各种规则实现各种不同的分类,看到过有些 ...

最新文章

  1. 银行背景下分库分表技术选型
  2. 赠书:《Java性能优化实践》,众多业内大佬推荐阅读
  3. 快速穷举TCP连接欺骗攻击-利用SYN Cookies
  4. String.subString内存泄露
  5. CodeForces - 1330D Dreamoon Likes Sequences(组合数学)
  6. 有道词典总显示无法连接服务器,有道词典无法联网提示网络已断开该怎么办
  7. 用户空间与内核空间数据交换的方式(2)------procfs
  8. GPL协议、LGPL协议与BSD协议的法律区别
  9. oracle j2ee数据库,J2EE连接远程Oracle数据库表
  10. 点播的时候出现 “S1-10921” 的错误
  11. sam格式的结构和意义_SAM文件格式介绍
  12. 测试人收入情况大曝光,你的收入在什么水平
  13. xp系统显示无打印机服务器,Xp系统显示“Windows无法打开添加打印机”的处理方法...
  14. 数据加密-国密SM2对数据进行加解密
  15. 油田生产数据选取22.4.1 观察实验
  16. stm32f407能跑linux吗_stm32能跑linux吗
  17. 分布式学习(3)etcd@2@HTTP API v2
  18. 跟我学c++高级篇——模板元编程之十一鸭子类型
  19. Microsoft Office Word 选中图片锐化 以及 所有图片锐化的宏代码
  20. stm32的flash和ram占用情况

热门文章

  1. 3D目标检测论文方法汇总 【2022部分持续更新中~
  2. Educational Codeforces Round 147 (Rated for Div. 2) 题解
  3. Java使用程序ZHConverter把工程内所有文件的简体字转换为繁体字
  4. java DecimalFormate格式化十进制数字(小数,千分号,百分比……)
  5. 《JAVA编程思想》学习笔记:第21章(并发)
  6. 共享服务器文件卷影恢复,Win2008下巧用卷影副本 实现按需恢复
  7. 福利 | 手把手教你做好一场技术分享
  8. 初创公司融资过程_初创企业和生产准备过程
  9. HTML网页常用的图像格式
  10. Python3 猴子偷桃