最近做毕设要用到SInC这个工具,往基因序列里插入拷贝数变异,然鹅,我对它一窍不通,网上资料也比较少,特此写篇博文来记录一下自己的心路历程

下载

SInC是在下面这篇论文中提出的,作者在文章里给了下载链接,文章地址附上:
SInC: an accurate and fast error-model based simulator for SNPs, Indels and CNVs coupled with a read generator for short-read sequence data

使用

因为本来也不是学 生信 的,原理啥的我也不懂,所以就直接说怎么用吧

这是官方给的使用说明:

SInC has 3 steps:

Step 1: Quality profile generation
Run “./genProfile” to generate
quality profile from your desired input file.
 
Usage: ./genProfile -R <read tag(1 for R1, 2 for R2)> -l <input.txt>
 
Example: ./genProfile -R 1 -l 100 input.txt

-> -R 1 means profile for R1.(Similarly run with -R 2 for R2)
-> -l 100 means read length 100
-> input.txt this file contains list of fastq files(1 file per line) to be used for profile generation.

Step 2: Simulation of SNPs, INDELs, CNVs
Run “./SInC_simulate” to
simulate SNPs, INDELs, CNVs.
 
Usage: ./SInC_simulate [options] <in.ref.fa>
 
Example: ./SInC_simulate -S 0.002 -I 0.0001 -p 2 -l 1000 -u 150000 -t
2
 
-> -S 0.002 means 0.002% of SNPs to be incorporated in the reference
-> -I 0.0001 means 0.0001% of INDELs to be incorporated in the reference
-> -p 2 means 2% of CNVs to be incorporated in the reference
-> -l 1000 means minimum size of CNV should be 1000
-> -u 150000 means maximum size of CNV should be 150000
-> -t 2 means ti/tv should be 2

NOTE:

  1. SInC will generate fasta file for both the alleles, so run read generator on both the files separately.
  2. Minimum evolutionary SNP rate is set to 0.0033.

Step 3: Read generation
Run “./SInC_readGen” for both the fasta files
generated in Step 2.
 
Usage: ./SInC_readGen [options] <in.ref.fa>
<read_1_profile.txt> <read_2_prof.txt>
 
Example: desired coverage 10 ./SInC_readGen -C 5 -T 1 -R 100
chr22_allele_1.fa 100_bp_read1_profile.txt 100_bp_read2_profile.txt
./SInC_readGen -C 5 -T 1 -R 100 chr22_allele_2.fa
100_bp_read1_profile.txt 100_bp_read2_profile.txt

-> -C 5 means fold coverage for chr22_allele_1.fa is 5
-> -T 1 means use 1 core
-> -R 100 means read length 100

以下是从一篇论文中摘出的SInC部分:

其他仿真软件

SInc是用C语言开发的一款仿真软件,它是开源的,拥有CLI接口,也有自己的error model,但是它存在的问题没有仿真CNA变异;

MetaSim是用JAVA语言开发的一款仿真软件,它拥有CLI和GUI接口,不是开源的,可以仿真pair-end数据,它的缺陷是只有序列生成部分而没有变异仿真部分,即没有将quality value赋值给reads;

FlowSim是用Haskell语言编写的,它拥有CLI接口,是一款开源仿真软件,它的缺陷是没有变异仿真部分且不能仿真Illumina平台的数据,即不能仿真paie-end数据;

GenFrag仿真软件是开源的,有CLI接口,它的缺点是没有变异仿真部分且它的erroe model过分简单;

DwgSim仿真软件是由变异仿真和序列生成两个部分构成的,它有CLI接口且是开源的,它的缺陷是不能模拟真实数据。当然,这些仿真软件共有的一个缺陷是不能仿真CNA变异。

SInC的下载及使用相关推荐

  1. iphone开发笔记和技巧总结

    在iphone程序中实现截屏的一种方法: //导入头文件   #importQuartzCore/QuartzCore.h //将整个self.view大小的图层形式创建一张图片imageUIGrap ...

  2. 包浆网图分分钟变高清,伪影去除、细节恢复更胜前辈AI,下载可玩|腾讯ARC实验室出品...

    丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 下面来欣赏一些高糊图片"整个世界都清晰了"的魔法时刻: 无论是动漫还是真实图像,是不是都清晰还原了? 以上就是由腾讯AR ...

  3. 生物信息学仿真软件SInC的初步使用教程

    1. 下载 软件下载:https://sourceforge.net/projects/sincsimulator/ paper: SInC: an accurate and fast error-m ...

  4. commons-math3 简介、中文文档、中英对照文档 下载

    commons-math3 文档 下载链接(含jar包.源码.pom) 组件名称 中英对照-文档-下载链接 中文-文档-下载链接 commons-math3-3.6.1.jar commons-mat ...

  5. matlab2c使用c++实现matlab函数系列教程-sinc函数

    全栈工程师开发手册 (作者:栾鹏) matlab2c动态链接库下载 matlab库函数大全 matlab2c基础教程 matlab2c开发全解教程 matlab2c调用方法: 1.下载动态链接库 2. ...

  6. Alibaba Cloud Linux 2.1903 LTS 64位服务器yum源下载404,Alibaba Cloud Linux 2实例中使用docker-ce、epel等YUM源安装软件失败

    [Alibaba Cloud Linux 2.1903 LTS 64位]服务器yum源下载404 failure: repodata/repomd.xml from docker-ce-stable: ...

  7. Redis学习之路(一)--下载安装redis

    redis学习之路--下载安装redis windows安装redis 1.下载redis 2.安装 3.查看是否安装成功 windows安装redis 1.下载redis 网址:https://gi ...

  8. 各bert 模型下载

    20210618 https://huggingface.co/bert-base-chinese/tree/main bert 官方 https://mirrors.tuna.tsinghua.ed ...

  9. github下载源码也用命令进行安装包的联系

    2.下载安装 git clone https://github.com/Parsely/pykafka.git 然后将下载下来的pykafka文件夹下的pykafka文件(pykafka的库文件)放到 ...

最新文章

  1. 中文任务全面超越BERT:百度正式发布NLP预训练模型ERNIE(附项目地址)
  2. 计算机组成801pan,计算机组成06801.ppt
  3. 几何着色器与细分(镶嵌)着色器
  4. SDL及扩展库在ARM-Linux 完整移植
  5. SAP Spartacus的Angular.json内容一览
  6. jQuery简单易用的网页内容打印插件
  7. xrdp协议_XRDP与VNC的关系(转载)
  8. 自动建议下拉菜单_word排版技巧:如何撤销删除自动编号
  9. APP_FIELD设置Item运行时行为
  10. 个人制作:AD库、元件库、封装库及3D模型,免费
  11. PBRT-V3体渲染笔记
  12. 萤火虫算法_一种优化方法:蜂鸟优化算法
  13. 微信小程序阻止默认冒泡事件
  14. Java程序-自制班级随机选人程序
  15. BZOJ3168. 【HEOI2013】钙铁锌硒维生素
  16. kafka消费组和分区关系详解
  17. 详解FC交换机基础知识
  18. windows 查看IP地址或端口是否可以连接-常用命令
  19. 携程ajax,Python爬虫实战之爬取携程评论
  20. Burp抓不了或者抓不全本地的包

热门文章

  1. 哪些技术会决定前端开发者的未来发展?
  2. 机器学习在信息安全领域的应用现状和畅想
  3. 智能硬件开发如何选择低功耗MCU?
  4. 军工品质32位超低功耗MCU
  5. Java实现Google的S2算法工具类
  6. 【055】工信部领导莅临翼辉参观指导工作
  7. HANA XS Administration Tool登录参数设置
  8. 导入的java文件不显示文字_java 引入自定义字体font后出现的硬盘吃光的问题
  9. Unity 知识点 - 3D游戏 - 视角跟随和键盘移动
  10. 2022R2移动式压力容器充装考题模拟考试平台操作