1. 下载

软件下载:https://sourceforge.net/projects/sincsimulator/
paper: SInC: an accurate and fast error-model based simulator for SNPs, Indels and CNVs coupled with a read generator for short-read sequence data

2. 使用

SInC有三个部分,分别对应三个可执行文件

2.1 genProfile 模拟测序质量分数

生成质量分数配置文件,这个是为了第三步生成read而准备的,如果是双末端测序,需要准备两个fastq文件(可以从一些生物信息学数据库汇总下载),该程序会从fastq文件中模拟其测序质量分数的分布,并生成相应read长的质量分数配置文件,提供第三步调用。

./genProfile -R 1 -l 100 input1.txt
./genProfile -R 2 -l 100 input2.txt
# -R 1 表示从正向测序
# -R 2 表示从反向测序

例如,对于双端测序的read,共有两个配对的fastq文件,input.txt内容如下

# input1.txt 文件格式(一个也可以,正向测序的fq)
test1_1.fq
test2_1.fq# input2.txt 文件格式(一个也可以,反向测序的fq)
test1_2.fq
test2_2.fq

2.2 SInC_simulate 模拟SNV,INDEL,CNV变异

这里仿真变异的三种类型是互相独立的,当其中一个的概率设置为0的时候,不会进行变异。

./SInC_simulate -S 0.002 -I 0.0001 -p 2 -l 1000 -u 150000 -t 2 chr21.fa
# -S 表示SNP发生变异的频率
# -I 表示Indel发生变异的频率
# -p 表示CNV发生变异的频率
# -l CNV变异的最短序列长度
# -u CNV变异的最长序列长度
# -t SNP变异中,转换:颠换的比例
# 最后是参考基因组fa文件

2.3 SInC_readGen 生成读段

把第二步模拟的fa文件,通过测序仪仿真生成fastq文件(默认是双端测序),这里还需要用到第一步生成的质量分数配置文件

./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_1.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_2.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt
# -C 表示测序深度
# -T 表示cpu核心数
# -R 表示每条read的长度
# chr22_allele_1.fa 第二步模拟的fa文件
# 100_bp_read1_profile.txt 第一步模拟的正向测序的质量分数配置文件
# 100_bp_read2_profile.txt 第一步模拟的反向测序的质量分数配置文件

2.5 官方readme

SInC has 3 steps:Step 1: Quality profile generation // 质量配置文件生成
Run  "./genProfile" to generate quality profile from your desired input file. //从你的期望的输入文件中生成quality profileUsage:./genProfile -R <read tag(1 for R1, 2 for R2)> -l <read length> <input.txt>Example:
./genProfile -R 1 -l 100 input.txt // 输入文本为fastq文件列表-> -R 1   means profile for R1.(Similarly run with -R 2 for R2)
-> -l 100   means read length 100
-> input.txt this file contains list of fastq files(1 file per line) to be used for profile generation. Step 2: Simulation of SNPs, INDELs, CNVs // 模拟SNPs, INDELs, CNVs等变异
Run "./SInC_simulate" to simulate SNPs, INDELs, CNVs.Usage:./SInC_simulate [options] <in.ref.fa>Example:
./SInC_simulate -S 0.002 -I 0.0001 -p 2 -l 1000 -u 150000 -t 2 chr21.fa-> -S 0.002  means 0.002% of SNPs to be incorporated(合并) in the reference // 1000个碱基包含两个snp
-> -I 0.0001 means 0.0001% of INDELs to be incorporated in the reference
-> -p 2   means 2% of CNVs to be incorporated in the reference
-> -l 1000  means minimum size of CNV should be 1000
-> -u 150000 means maximum size of CNV should be 150000
-> -t 2   means ti/tv should be 2 // NOTE:
1. SInC will generate fasta file for both the alleles, so run read generator on both the files separately.
//1. SInC 将为两个等位基因生成 fasta 文件,因此分别对这两个文件运行读取生成器。
2. Minimum evolutionary SNP rate is set to 0.0033.
//2.最小进化 SNP 率设置为 0.0033。Step 3: Read generation
Run "./SInC_readGen" for both the fasta files generated in Step 2.
Usage:./SInC_readGen [options] <in.ref.fa> <read_1_profile.txt> <read_2_prof.txt>Example: desired coverage 10
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_1.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_2.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt-> -C 5  means fold coverage for chr22_allele_1.fa is 5
-> -T 1  means use 1 core
-> -R 100 means read length 100

3. 报错

该软件运行在linux环境下,需要gsl
如果运行过程中报如下错误,参考我的另一篇文章:关于部分软件运行报错,找不到libgsl.so.0的解决方案

error while loading shared libraries: libgsl.so.0: cannot open shared object file: No such file or directory

生物信息学仿真软件SInC的初步使用教程相关推荐

  1. 里面使用轮播_小程序ColorUI框架初步使用教程及个人项目实战

    小程序ColorUI框架初步使用教程及个人项目实战 最近在写自己的一个微信小程序项目<阿涛技术博客>,目前还在写前端小程序部分,之前我有用过小Weiui,Linui等微信小程序UI框架,在 ...

  2. ABB机器人仿真软件robotstudio v6.08安装教程

    ABB机器人仿真软件robotstudio v6.08安装教程 具体步骤可参考以下内容: 注意:安装之前,最好将电脑的名称改为英文,否则可能会安装不成功, 第1步:将下载的安装包解压缩, 第2步:找到 ...

  3. Python3初步实践教程概要

    "人生苦短,快学Python" "Life is short, you need Python!" ---- Bruce Eckel Python作为一门脚本语 ...

  4. Redis的初步使用教程

    Redis的安装 redis的下载地址:https://github.com/tporadowski/redis/releases 详细安装教程可以直接看这里:菜鸟教程 Redis的启动 接下来以我的 ...

  5. java初步编程教程,2022最新

    Java互联网开发编程系列课程-开发环境搭建教程视频学习网址:player.MzAyOTAwMA==从今天主要带大家一起来学习下Java入门系列编程课程,希望能帮助想学习互联网开发编程小伙伴们,想从事 ...

  6. 使用机器人操作系统ROS 2和仿真软件Gazebo 9搭建机器人教程(一)

    参考链接:https://github.com/bunchofcoders/basic_bocbot 本文为使用ROS 2和Gazebo9搭建仿真机器人详细指南. 确保已按如下说明安装ROS和Gaze ...

  7. LBM模式学习·保姆级安装及初步使用教程

    在学习LBM模式的过程中,我感觉LBM模式流程简短.运行方便,但是可供参考的材料较为有限,对于一个独立学习LBM模式的初学者非常不友好(我就是这个初学者哈哈,此前从未独立运行过任何模式),因此萌生了写 ...

  8. 无人机/无人车仿真软件学习与实践---CoppeliaSim教程1---Win10/Win11下的安装

    下载 地址:https://www.coppeliarobotics.com/downloads 选择教育版本(Edu)下载,本人下载的是CoppeliaSim V4.3.0版本(本教程全部基于改版本 ...

  9. CTex完整、详细、亲测安装教程,初步使用教程

      LaTeX(LATEX,音译"拉泰赫")是一种基于ΤΕΧ的排版系统,由美国计算机学家莱斯利·兰伯特(Leslie Lamport)在20世纪80年代初期开发,利用这种格式,即使 ...

最新文章

  1. access 提供程序无法确定object 值_Python | 加一行注释,让你的程序提速10+倍!numba库十分钟上手指南...
  2. GCN代码超详解析Two-stream adaptive graph convolutional network for Skeleton-Based Action Recognition(一)
  3. 数值范围_如何理解PLC对数值运算的定义与处理方式?
  4. 鼠标事件onmouuse大全
  5. mysql几个timeout参数_MySQL中 timeout相关参数解析
  6. 编写优雅代码,从挖掉恶心的if/else 开始
  7. python行业数据分析_python在数据分析
  8. mysql5.7 timestemp default value error
  9. 汉王考勤程序驱动软件安装
  10. js 删除QQ空间的说说
  11. 计算机网络与互联网的区别,计算机网络与互联网的主要区别是什么?
  12. 厌倦只是一瞬间的事 2012-03-29 09:54:01 明明该有许多话要交代下去有许多事要汇报上去,明明有很多事情要去做,可是偏偏都不想去。可是突然还是打算留在电脑前漫无目的地把时间都耗费在了
  13. ICMAX解析无线路由器WAN口应该怎么设置
  14. 双鱼林php学生信息管理系统,双鱼林基于ThinkPHP5图书管理系统demo v1.0
  15. 计算机语言替换,Zig 0.7.0 发布,想要替换 C的编程语言
  16. ssm私人牙科诊所病例管理系统的设计与实现毕业设计源码071128
  17. 用php编写多项选择题_php试题
  18. [OpenSource] AWBot-一款小巧的测试Web站点的工具
  19. 1+X Web前端开发初级考试 模拟试题(一)
  20. 3个表单设计的最佳技巧

热门文章

  1. SpringBoot整合Quartz--使用/教程/实例
  2. 12032 解救小哈
  3. 跟着小哈一起读AHT20温湿度传感器驱动源码
  4. 关于学术道德,我们应该遵循的规范
  5. QTP/UFT能捕捉到对象但是点击不了,录制点击也没反应
  6. 本周最新文献速递20211121
  7. 3DMAX渲染AO(白膜)图的三种方法
  8. win8/win10微信QQ邮箱可登陆,浏览器显示无网络连接
  9. 落魄前端,整理给自己的前端知识体系复习大纲(上篇,2w字)
  10. PPT中修改已插入对象的图标