1. 软件下载

structure
Windows版建议安装桌面版(graphical front end), Linux建议安装终端版(without front end)

2. 安装指南

Instructions

Windows
直接双击安装包, 进行安装即可. 安装完成后, 桌面上有快捷方式:

Mac OS X
软件包是一个可执行文件, 双击Structure.dmg, 会打开软件, 创建一个快捷方式即可.

Unix/Linux

下载软件包, 解压进入软件包文件夹, 会有structure可执行文件, 运行./structure即可.

wget https://web.stanford.edu/group/pritchardlab/structure_software/release_versions/v2.3.4/release/structure_linux_console.tar.gz
tar zxvf structure_linux_console.tar.gz
cd console/
./structure

出现下面代码, 说明运行成功:

(base) [dengfei@localhost console]$ ./structure----------------------------------------------------
STRUCTURE by Pritchard, Stephens and Donnelly (2000)and Falush, Stephens and Pritchard (2003)Code by Pritchard, Falush and HubiszVersion 2.3.4 (Jul 2012)
----------------------------------------------------Reading file "mainparams".
datafile is
infile
Reading file "extraparams".
Note: RANDOMIZE is set to 1. The random number generator will be initialized using the system clock, ignoring any specified value of SEED.
Unable to open the file infile.Exiting the program due to error(s) listed above.

3. 示例数据

示例数据

五种类型的数据:

  • Simulated microsatellite test data
  • AFLP data from whitefish.
  • SNP and microsatellite data from the HGDP.
  • Thrush data from original Structure paper
  • Simulated microsatellite data with location information

4. plink数据格式转化为structure

.recode.strct_in (Structure format)
Produced by "--recode structure", for use by Structure. This format cannot be loaded by PLINK.A text file with two header lines: the first header line lists all V variant IDs, while each entry in the second line is the difference between the current variant's base-pair coordinate and the previous variant's bp coordinate (or -1 when the current variant starts a new chromosome). This is followed by one line per sample with the following 2V+2 fields:1. Within-family ID
2. Positive integer, unique for each FID
3-(2V+2). Genotype calls, with the A1 allele coded as '1', A2 = '2', and missing = '0'

用法:
使用参数--recode structure, 结果生成:.recode.strct_in的后缀文件.
plink --file name --recode structure --out result

还可以使用Mega2进行格式转化, 转化方法

5. 使用admixture的数据进行测试

查看数据:

(base) [dengfei@localhost test]$ ls
hapmap3.bed  hapmap3.bim  hapmap3.fam  hapmap3.map

使用plink进行格式转化:

plink --bfile hapmap3 --recode structure --out test_structure

生成test_structure.recode.strct_in文件, 用这个文件进行操作.

数据格式如下:

rs10458597 rs12562034 rs2710875 rs11260566 rs1312568 rs35154105 rs16824508 rs2678939 rs7553178 rs133763
-1 203827 209332 200465 206966 213697 200280 201401 204163 202132 226411 200445 201484 200329 205708 20
NA19916 1 2 2 2 2 1 1 2 2 2 2 2 2 1 2 1 2 2 2 1 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 1 2 1 1 1 2 1 2 1 2 1 2 1
NA19835 2 2 2 1 2 1 2 1 2 2 2 2 2 2 2 1 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 1 2 2 2 2 2 1 2 1
NA20282 3 2 2 2 2 1 2 1 2 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 1 2 2 2 2 2 1 2 1 1 2 2 1
NA19703 4 2 2 2 2 1 2 2 2 1 2 2 2 2 2 1 2 2 2 1 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 1 2 2 2 1 2 1 2 2 2 2
NA19901 5 2 2 2 2 1 2 1 2 2 2 2 2 2 2 1 1 2 2 1 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 1 2 1 1 1 2 1 1 2
NA19908 6 2 2 1 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 1
NA19914 7 2 2 2 2 2 2 2 2 1 1 2 2 2 2 1 1 1 2 2 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 1
NA20287 8 2 2 2 2 1 1 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 2 2 1 2 2 2 2 2 1 2 1 2 1 2 1 1 2 2 2 2 2
NA19713 9 2 2 2 2 1 2 1 2 2 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 1 1 2 2 1 2 2 2 2 2 1 2 1 1 2 2 1 2 1 2 2 2 2
NA19904 10 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 1 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 1 2 2 2 2 2 2 2 2 2 0 0
NA19917 1 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1

6. 导入数据到structure软件中

双击打开软件

点击File, 点击New Project

键入名称: name1(自己命名即可)
选择文件所在的文件夹
选择文件

数据可以提前预览, 可以看到:
个体数为: 324
SNP个数为: 13928
缺失定义为 -999

定义好之后:点击Next

定义行

  • 勾选: Row of marker names
  • 勾选: Row of recessive alleles
  • 勾选: Data file storges data for individuals in a single line

    定义列:

读入数据成功:

7. 定义参数


参数命名为t1


定义为3个群体.

开始运行:

8. 查看结果

结果文件:

9. 使用admixture作为结果对比

 admixture hapmap3.bed 3

10. 使用admixture指定群体


如果没有群体的信息, 是无监督的学习, 会根据G矩阵进行自分类. 但是, 这种情况很少见, 一般我们都有一些先验性的信息, 比如已知某些个体是属于某一类群的, 这样分析效果更好.

这样, 通过定义已知的个体的群体信息, 分类变为了有监督的学习(supervised learning ), admixture通过定义一个文件.pop,

pop文件特点, 前缀和ped或者bed前缀一样, 一行内容, 如果已知群体, 定义群体名称, 如果未知, 用-或者空格表示, 单独一行.

比如, 如果9个个体, 6个知道群体类型,3个不知道群体类型, 定义如下:

A
A
-
-
B
B
A
-
B

运行命令时, 加上参数: --supervised

这里, test.pop, 为手动生成的pop文件, 生成代码如下:

a = data.frame(V1 = rep(c("A","-","B","-","C","-"),each=54))
write.csv(a,"test.pop",row.names=F,quote=F)
 admixture test.ped 3 --supervised

绘图:

PS

YouTube Structure 操作视频
GCTA PCA分析以及软件安装教程
Admixture使用说明文档cookbook

structure 2.3.4 软件使用指南相关推荐

  1. 文本分析软件_读书笔记:伍多库卡茨质性文本分析:方法、实践与软件使用指南...

    读书笔记:伍多·库卡茨<质性文本分析:方法.实践与软件使用指南> 一.这篇文章.这本书或这篇论文的中心思想.核心观点是什么?核心观点:质性数据如何系统化分析?三大主要方法:主题分析.评估分 ...

  2. 开源之旅之开源企业软件采购指南

    开源之旅之开源企业软件采购指南 ( 2006-02-06 10:31:09)   [导读]:从开源数据库.应用服务器,到开源的Web服务器,我们已经带您领略开源软件世界的旖旎风光.此次的"开 ...

  3. 杜比dss200服务器系统升级包434,杜比数字影院系统DSS200软件升级指南(初稿).pdf

    杜比数字影院系统DSS200软件升级指南(初稿).pdf 杜比数字影院系统软件升级指南 升级注意事项 : 1.升级将导致所有影片密钥丢失,请先做好备份 2 .升级前请先断开 DSP200 和 CAT. ...

  4. 企业项目化管理【一】:项目管理软件选型指南

    项目管理软件选型指南 --企业项目化管理  孙大伟 项目管理软件将取代OA,成为企业管理基础业务平台,这是大势所趋. OA,即办公自动化系统,其使命是将手工的日常行政工作搬到软件上实现,主要为金字塔型 ...

  5. erp5开源制造业erp和dream生产排程软件集成指南

    erp5开源制造业erp和dream生产排程软件集成指南 1 在dream生产排程软件中定义产品工艺路线,导入到erp5 2 在erp5中生成制造订单,导入到dream 3 在dream中定义设备生产 ...

  6. 群体进化,群体结构分析之STRUCTURE分析三款软件比较

    STRUCTURE分析三款软件比较 三篇高引用文章 2005-STRUCTURE[1] 把选k值写的很清楚 2020/5/16 引用13119 这篇文章发表的时候二代测序还没兴起,ssr等的标记数量有 ...

  7. 计算机二级 access应用,计算机二级Access辅导:Access软件应用指南

    计算机二级Access辅导:Access软件应用指南 本文是百分网小编搜索整理的关于计算机二级Access辅导:Access软件应用指南,供参考学习,希望对大家有所帮助!想了解更多相关信息请持续关注我 ...

  8. 你需要知道的系统还原软件选用指南

    系统还原对于大多数人来说还是比较陌生的,很多用户在选用系统还原软件的时候会遇到障碍,不知道哪款系统还原软件适合自己当前的情况.目前,系统还原用的比较多的是冰点还原和影子系统,那么两者的区别在什么地方呢 ...

  9. 应用计算机软件指南,2017计算机二级Access软件应用指南

    2017计算机二级Access软件应用指南 引导语:考试前先要了解考试软件的应用,以下是百分网小编分享给大家的2017计算机二级Access软件应用指南,欢迎阅读! 1.1全国计算机等级考试上机考试系 ...

  10. 计算机辅助翻译风格指南,软件培训指南英汉翻译实践报告

    摘要: 平行文本指的是产生于不同环境但属于相同的文本类型.具有相同功能的文本,五十年代以来平行文本主要用于大学口译培训,八十年代中后期平行文本开始逐步运用于应用型翻译.作为应用型翻译的分支,软件培训指 ...

最新文章

  1. java val$name_匿名内部类 this.val$的问题
  2. 机器学习—决策树构造算法的python实现
  3. linux基于usb启动配置
  4. 如何在SAP C4C里使用ABSL消费第三方Restful API
  5. Aspcms框架的webshell
  6. LeetCode 756. 金字塔转换矩阵(回溯)
  7. BugkuCTF-Reverse题Easy_vb多方法解决
  8. 解读ASP.NET 5 MVC6系列(13):TagHelper
  9. 安装中文VS2008 SP1 和.NETFRAMEWORK 3.5SP1后智能提示是英文的解决办法
  10. apache commons - lang 常用方法记录
  11. 计算机网络 五层网络协议各司其职,一次讲清楚
  12. Javascript你必须要知道的面试题
  13. android 手势截图,小米8手机如何截图/长截屏/手势截屏?小米8四种截图方法
  14. 个人博客被恶意刷关键词的两次经历
  15. 基于 Verilog 的经典数字电路设计(14)移位寄存器
  16. java 504错误怎么解决_前端报504错误如何定位
  17. 笔记本电脑光驱位置装固态硬盘流程
  18. win10系统安装Webloic12C操作方法
  19. oracle的解除锁表
  20. 我们软件开发常用的协作工具

热门文章

  1. 面试问题之AOP实现原理
  2. 架构实战体会,结合《蔡学镛:架构的5个观察角度》
  3. DWG文件打开乱码怎么办?
  4. 数字图像处理——最大类间方差法(OTSU)图像阈值分割实例
  5. 假期无聊 就来试试用Python做一个智能识别 包教会哦 多图预警:配置Pyqt5超详细解说(designer.exe和pyuic.exe)以及项目:Python实现百度智能识别,识别各种实物
  6. 常用测试用例设计方法4-场景法
  7. python因子分析法详细步骤_Python——因子分析
  8. 单维度量表验证性因子分析_(超详细)验证性因子分析步骤讲解
  9. ios、iphone越狱获取系统文件权限
  10. AS4120原厂单节 2A 开关型锂离子电池充电芯片