一、功能分类:

测序数据模拟

二、软件官网:

https://github.com/lh3/wgsim

三、软件介绍:

wgsim是一块用于高通量数据模拟的软件,whole genome simulation。这款软件可以模拟出illumina测序数据,并且可以自由调整测序reads的读长,插入片段大小以及错误率等,使用起来比较方便。模拟数据主要用于软件的测试与评估。例如对序列拼接软件的评估。因为模拟数据是根据已有的参考序列来的,我们可以将模拟出来的数据进行拼接,再将拼接的结果与原序列进行比对。这样就能每次调整单因素变量,例如比较不同reads读长,不同插入片段大小或者不同错误率条件下,对序列拼接的影响。
也可以为参考序列模拟变异位点,例如点突变、片段获得缺失等,然后模拟数据,评估软件是否可以检测出这些变异位点。
这个过程中,模拟出可控条件的数据是非常重要的。
但是,这里面我们也要认识到,实际测序中影响的因素是非常多的,模拟数据是很难和实际数据相匹配的,比如拼接软件对模拟数据表现出非常好的效果,但是对实际测序数据可能非常差。

四、下载安装:

git clone  https://github.com/lh3/wgsim.git
gcc -g -O2 -Wall -o wgsim wgsim.c -lz -lm

五、软件使用:

软件比较简单,输入文件为基因组序列,fasta格式,输出为illumina的fastq格式,这些格式我们在前面都介绍过。然后是一些选项。
-e 是错误率,默认是0.02
-d reads两头的距离,也就是插入片段长度,默认250bp,注意插入片段本身是包含reads长度的,而不是reads之间的距离
-s 是-d插入片段的偏差,默认是20,也就是-d的值加减20,我们知道插入片段长度并不是固定的,而是一个范围
-N 是测序的层数,控制输出数据量
-1 是reads1长度,默认70bp
-2 是reads2长度,默认70bp
-r 突变率
-R -X 都是调整indels的
-h 是单倍体模式
下面我们来运行一下
wgsim 参考序列 reads1 reads2 这里插入片段我们选择500bp,偏差-s在50,reads长度-1 -2为100bp,二者可以不一样,其余默认。

六、使用案例:

wgsim ref.fna reads1.fq reads2.fq -d 500 -s 50 -1 90 -2 90

七、注意事项:

1、模拟出的reads质量值是无法更改的,都是“I”,如果程序用到reads的质量值模拟数据就会有问题。
2、不支持Mate-pair文库,就是即使把-d设置微6K,那么它是不能像实际过程中发生环化的,两条reads的方向和小片段还是一样的。

二代数据 模拟软件wgsim相关推荐

  1. 分子动力学模拟软件_基于GPU的分子动力学软件ACEMD的简介与安装

    Acellera软件包括HTMD.ACEMD.AceCloud.Parameterize.AceFlow和ACEMD3模块. ACEMD简介 ACEMD是一款功能强大的生物分子动力学模拟软件包,该软件 ...

  2. Modebus Slave 与 Modbus Poll主从设备模拟软件与Configure Virtual Serial串口模拟软件使用

    场景 Configure Virtual Serial Port Driver 1.多个虚拟串口映射: 2.收/发多线程架构发多线程架构: 3.支持虚拟串口参数同步指令支持虚拟串口参数同步指令: 4. ...

  3. 二元相图软件_Materials Studio 领先的材料模拟软件

    BIOVIA MATERIALS STUDIO拥有完善的建模和模拟工具,能够帮助材料科学与化学领域的研究者对材料中原子.分子结构与性质.性能间的关系进行预测.利用Materials Studio,各工 ...

  4. Schrodinger分子动力模拟软件与UltraLAB建模工作站配置探讨

        Schrodinger 2018-1是Schrodinger软件的最新版本,也是目前计算化学领域的领导者,能够为生命科学和材料研究提供软件解决方案和服务.该软件并不是独立,而是一个软件合集包, ...

  5. 11 阶段总结一:详解OS的引导启动过程(含Bochs模拟软件的使用)

    阶段总结一:详解OS的引导启动过程 0 前文总结 1 BIOS的自述 2 MBR的面目 3 bochs模拟系统的基本使用 3.0 bochs的简介 3.1 *.bxrc配置文件选项解析(重点) 3.2 ...

  6. STEM图像模拟软件QSTEM入门教程-测试狗

    QSTEM是由德国柏林洪堡大学的Koch开发的STEM图像模拟软件(图2),它是在多层切片算法的基础上采用冻结声子逼近法进行HAADF-STEM图像分析的软件,能够对关键实验因素(例如样品厚度.检测器 ...

  7. ProMax v2.0.7047 1CD流程模拟软件

    ProMax v2.0.7047 1CD流程模拟软件 SIMULIA ABAQUS 2016.0 Win64 & Linux64 2DVD工程模拟的有限元 MPMM Professional ...

  8. 移动数据和软件更新系统及方法

    名称: 移动数据和软件更新系统及方法 摘要: 在分布式系统(100)中,在多个企业数据源(108)和移动客户机(102)间共享数据,使得接收来自移动客户机(102)的对于企业数据的请求,确定包含请求数 ...

  9. 塑料高分子应用计算机,分子模拟方法与模拟软件Materials+Studio在高分子材料中的应用.pdf...

    塑 料 庄吕清等--分了模拟方法及模拟软件MaterialsStudio在高分了材料中的应用 2010年39卷第4期 嵛誓.o.tjl:?.':'j1 恭.j.t?lt.j一.o..0 分子模拟方法及 ...

最新文章

  1. GNU AWK中BEGIN/END使用举例
  2. VTK:二次方用法实战
  3. 计算机网络——因特网的接入技术
  4. 7-2 城市间紧急救援 (25 分)
  5. apkrenamer_实用软件ApkRenamer:一键重命名apk包
  6. VS2010测试功能之旅:编码的“.NET研究”UI测试(2)-操作动作的录制原理(上)...
  7. python除法运算定律_除法竖式算法的原理是什么?
  8. 互联网产品的测试策略应该如何设计?
  9. Windwows7 下安装mysql5
  10. 一级计算机考试中的DBF,2017年计算机等考一级WPS2000辅导:使用DBF格式内容的方法...
  11. kubernetes视频教程笔记 (2)-kubernetes的组件
  12. php抓取访客国旗,爬取世界各国和地区数据国旗和国徽的高清图标和图片
  13. shell脚本语法教程
  14. bootice添加linux_用BOOTICE工具在U盘上实现SYSLINUX与GRUB4DOS双启动 - 图文
  15. 学金融离不开计算机,如何看待学计算机的被学金融的鄙视
  16. 前端、后端、学习网址
  17. Booth除法器设计
  18. 【信号去噪】基于改进的阈值高斯脉冲信号去噪含Matlab源码
  19. 六级考研单词之路-二十一
  20. 不用密码解密压缩文件(CRC32算法)

热门文章

  1. IROS 2021 | 相机数据转化为2D激光伪标签的自监督学习行人检测
  2. 远程服务器的环境的配置
  3. 【错误总结】LaTex Warning: citation undefined
  4. python整数二进制有多少个1_几种统计一个二进制数内有几个1的方法
  5. 360浏览器登录_360安全浏览器12下载-360安全浏览器12最新版下载
  6. Science Bulletin:绝对丰度的植物根际微生物群落“扩增-选择”模型
  7. 宏基因组、微生物、环境杂志影响因子(IF)及变化分析
  8. ISME: 北大吴晓磊组发现囊泡为细菌利用环境血红素提供全新途径
  9. Microbiome:中科院遗传发育所揭示植物发育和氮肥共同作用下的小麦根系微生物组...
  10. MITRE:利用微生物组时间序列数据推断与宿主状态变化相关的特征