生物信息学仿真软件SInC的初步使用教程
1. 下载
软件下载:https://sourceforge.net/projects/sincsimulator/
paper: SInC: an accurate and fast error-model based simulator for SNPs, Indels and CNVs coupled with a read generator for short-read sequence data
2. 使用
SInC有三个部分,分别对应三个可执行文件
2.1 genProfile 模拟测序质量分数
生成质量分数配置文件,这个是为了第三步生成read而准备的,如果是双末端测序,需要准备两个fastq文件(可以从一些生物信息学数据库汇总下载),该程序会从fastq文件中模拟其测序质量分数的分布,并生成相应read长的质量分数配置文件,提供第三步调用。
./genProfile -R 1 -l 100 input1.txt
./genProfile -R 2 -l 100 input2.txt
# -R 1 表示从正向测序
# -R 2 表示从反向测序
例如,对于双端测序的read,共有两个配对的fastq文件,input.txt内容如下
# input1.txt 文件格式(一个也可以,正向测序的fq)
test1_1.fq
test2_1.fq# input2.txt 文件格式(一个也可以,反向测序的fq)
test1_2.fq
test2_2.fq
2.2 SInC_simulate 模拟SNV,INDEL,CNV变异
这里仿真变异的三种类型是互相独立的,当其中一个的概率设置为0的时候,不会进行变异。
./SInC_simulate -S 0.002 -I 0.0001 -p 2 -l 1000 -u 150000 -t 2 chr21.fa
# -S 表示SNP发生变异的频率
# -I 表示Indel发生变异的频率
# -p 表示CNV发生变异的频率
# -l CNV变异的最短序列长度
# -u CNV变异的最长序列长度
# -t SNP变异中,转换:颠换的比例
# 最后是参考基因组fa文件
2.3 SInC_readGen 生成读段
把第二步模拟的fa文件,通过测序仪仿真生成fastq文件(默认是双端测序),这里还需要用到第一步生成的质量分数配置文件
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_1.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_2.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt
# -C 表示测序深度
# -T 表示cpu核心数
# -R 表示每条read的长度
# chr22_allele_1.fa 第二步模拟的fa文件
# 100_bp_read1_profile.txt 第一步模拟的正向测序的质量分数配置文件
# 100_bp_read2_profile.txt 第一步模拟的反向测序的质量分数配置文件
2.5 官方readme
SInC has 3 steps:Step 1: Quality profile generation // 质量配置文件生成
Run "./genProfile" to generate quality profile from your desired input file. //从你的期望的输入文件中生成quality profileUsage:./genProfile -R <read tag(1 for R1, 2 for R2)> -l <read length> <input.txt>Example:
./genProfile -R 1 -l 100 input.txt // 输入文本为fastq文件列表-> -R 1 means profile for R1.(Similarly run with -R 2 for R2)
-> -l 100 means read length 100
-> input.txt this file contains list of fastq files(1 file per line) to be used for profile generation. Step 2: Simulation of SNPs, INDELs, CNVs // 模拟SNPs, INDELs, CNVs等变异
Run "./SInC_simulate" to simulate SNPs, INDELs, CNVs.Usage:./SInC_simulate [options] <in.ref.fa>Example:
./SInC_simulate -S 0.002 -I 0.0001 -p 2 -l 1000 -u 150000 -t 2 chr21.fa-> -S 0.002 means 0.002% of SNPs to be incorporated(合并) in the reference // 1000个碱基包含两个snp
-> -I 0.0001 means 0.0001% of INDELs to be incorporated in the reference
-> -p 2 means 2% of CNVs to be incorporated in the reference
-> -l 1000 means minimum size of CNV should be 1000
-> -u 150000 means maximum size of CNV should be 150000
-> -t 2 means ti/tv should be 2 // NOTE:
1. SInC will generate fasta file for both the alleles, so run read generator on both the files separately.
//1. SInC 将为两个等位基因生成 fasta 文件,因此分别对这两个文件运行读取生成器。
2. Minimum evolutionary SNP rate is set to 0.0033.
//2.最小进化 SNP 率设置为 0.0033。Step 3: Read generation
Run "./SInC_readGen" for both the fasta files generated in Step 2.
Usage:./SInC_readGen [options] <in.ref.fa> <read_1_profile.txt> <read_2_prof.txt>Example: desired coverage 10
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_1.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_2.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt-> -C 5 means fold coverage for chr22_allele_1.fa is 5
-> -T 1 means use 1 core
-> -R 100 means read length 100
3. 报错
该软件运行在linux环境下,需要gsl
如果运行过程中报如下错误,参考我的另一篇文章:关于部分软件运行报错,找不到libgsl.so.0的解决方案
error while loading shared libraries: libgsl.so.0: cannot open shared object file: No such file or directory
生物信息学仿真软件SInC的初步使用教程相关推荐
- 里面使用轮播_小程序ColorUI框架初步使用教程及个人项目实战
小程序ColorUI框架初步使用教程及个人项目实战 最近在写自己的一个微信小程序项目<阿涛技术博客>,目前还在写前端小程序部分,之前我有用过小Weiui,Linui等微信小程序UI框架,在 ...
- ABB机器人仿真软件robotstudio v6.08安装教程
ABB机器人仿真软件robotstudio v6.08安装教程 具体步骤可参考以下内容: 注意:安装之前,最好将电脑的名称改为英文,否则可能会安装不成功, 第1步:将下载的安装包解压缩, 第2步:找到 ...
- Python3初步实践教程概要
"人生苦短,快学Python" "Life is short, you need Python!" ---- Bruce Eckel Python作为一门脚本语 ...
- Redis的初步使用教程
Redis的安装 redis的下载地址:https://github.com/tporadowski/redis/releases 详细安装教程可以直接看这里:菜鸟教程 Redis的启动 接下来以我的 ...
- java初步编程教程,2022最新
Java互联网开发编程系列课程-开发环境搭建教程视频学习网址:player.MzAyOTAwMA==从今天主要带大家一起来学习下Java入门系列编程课程,希望能帮助想学习互联网开发编程小伙伴们,想从事 ...
- 使用机器人操作系统ROS 2和仿真软件Gazebo 9搭建机器人教程(一)
参考链接:https://github.com/bunchofcoders/basic_bocbot 本文为使用ROS 2和Gazebo9搭建仿真机器人详细指南. 确保已按如下说明安装ROS和Gaze ...
- LBM模式学习·保姆级安装及初步使用教程
在学习LBM模式的过程中,我感觉LBM模式流程简短.运行方便,但是可供参考的材料较为有限,对于一个独立学习LBM模式的初学者非常不友好(我就是这个初学者哈哈,此前从未独立运行过任何模式),因此萌生了写 ...
- 无人机/无人车仿真软件学习与实践---CoppeliaSim教程1---Win10/Win11下的安装
下载 地址:https://www.coppeliarobotics.com/downloads 选择教育版本(Edu)下载,本人下载的是CoppeliaSim V4.3.0版本(本教程全部基于改版本 ...
- CTex完整、详细、亲测安装教程,初步使用教程
LaTeX(LATEX,音译"拉泰赫")是一种基于ΤΕΧ的排版系统,由美国计算机学家莱斯利·兰伯特(Leslie Lamport)在20世纪80年代初期开发,利用这种格式,即使 ...
最新文章
- access 提供程序无法确定object 值_Python | 加一行注释,让你的程序提速10+倍!numba库十分钟上手指南...
- GCN代码超详解析Two-stream adaptive graph convolutional network for Skeleton-Based Action Recognition(一)
- 数值范围_如何理解PLC对数值运算的定义与处理方式?
- 鼠标事件onmouuse大全
- mysql几个timeout参数_MySQL中 timeout相关参数解析
- 编写优雅代码,从挖掉恶心的if/else 开始
- python行业数据分析_python在数据分析
- mysql5.7 timestemp default value error
- 汉王考勤程序驱动软件安装
- js 删除QQ空间的说说
- 计算机网络与互联网的区别,计算机网络与互联网的主要区别是什么?
- 厌倦只是一瞬间的事 2012-03-29 09:54:01 明明该有许多话要交代下去有许多事要汇报上去,明明有很多事情要去做,可是偏偏都不想去。可是突然还是打算留在电脑前漫无目的地把时间都耗费在了
- ICMAX解析无线路由器WAN口应该怎么设置
- 双鱼林php学生信息管理系统,双鱼林基于ThinkPHP5图书管理系统demo v1.0
- 计算机语言替换,Zig 0.7.0 发布,想要替换 C的编程语言
- ssm私人牙科诊所病例管理系统的设计与实现毕业设计源码071128
- 用php编写多项选择题_php试题
- [OpenSource] AWBot-一款小巧的测试Web站点的工具
- 1+X Web前端开发初级考试 模拟试题(一)
- 3个表单设计的最佳技巧