使用宏基因组的方法快速鉴定新冠病毒SARS-CoV2

一、如果不考虑成本,可以使用宏基因组测序的方法来快速鉴定新冠病毒SARS-CoV2,这种方法无需扩增、分析简单、准确度高。原理是直接将测序得到的序列数据与分类物种数据库比对,从而得到鉴定结果。本文使用centrifuge工具来进行物种(病毒)分类鉴定

二、 流程概览图如下,是不是很简单?

流程输入 SRR10971381_1.fastq.gz SRR10971381_2.fastq.gz

测试数据下载
SRX7636886: Complete genome of a novel coronavirus associated with severe human respiratory disease in Wuhan, China
1 ILLUMINA (Illumina MiniSeq) run: 28.3M spots, 8G bases, 2.6Gb downloads

使用NCBI官方工具sra-toolkit拆分成fastq.gz文件 fastq-dump SRR10971381 --split-3 --gzip
得到SRR10971381_1.fastq.gz SRR10971381_2.fastq.gz

分析流程文件(可一键导入sliverworkspace运行)及报告文件,conda环境文件下载,导入操作

运行环境 docker image based on ubuntu21.04 Conda Mamba(默认使用清华源) ssh
分析软件 - fastp=0.23.2
- fastqc=0.11.9
- multiqc=1.13
- centrifuge=1.0.4

pavian docker 镜像
- florianbw/pavian:latest

输出结果 multiqc_report.html 测序数据trim前后质量数据
SRR10971381.clean.report.tsv 分类鉴定报告文件
SRR10971381.clean.result.tsv 分类鉴定统计结果
SRR10971381.kraken2.report.tsv kraken格式的鉴定报告格式,便于pavian用来图形化交互分析
Uploaded_sample_set-report.html pivian导出的报告

环境搭建: 为了快速完成环境搭建,节省95%以上时间。

本文使用docker + conda (mamba) 作为基础分析环境,镜像获取:docker/docker-compoes 的安装及镜像构建见基于docker的生信基础环境镜像构建》,docker镜像基于ubuntu21.04构建,并安装有conda/mamba,ssh服务。并尝试初次运行时初始化安装所需软件下载所需文件(作为代价首次运行时间会较长,切需网络通畅),即实现自动初始化的分析流程。

备注:docker运行的操作系统,推荐为Linux,windows,macOS系统改下docker可能部分功能(网络)不能正常运行

# 拉取docker镜像
docker     pull     doujiangbaozi/sliverworkspace:latest# 查看docker 镜像
docker     images

基础环境配置,docker-compose.yml 配置文件,可以根据需要自行修改调整

version: "3"
services:SarsCov2:image: doujiangbaozi/sliverworkspace:latestcontainer_name: SarsCov2volumes:- /media/sliver/Data/data:/opt/data:rw                               #挂载原始数据,放SC2目录下- /media/sliver/Manufacture/SC2/envs:/root/mambaforge-pypy3/envs:rw  #挂载envs conda环境目录- /media/sliver/Manufacture/SC2/config:/opt/config:rw                #挂载config conda配置文件目录- /media/sliver/Manufacture/SC2/ref:/opt/ref:rw                      #挂载reference目录- /media/sliver/Manufacture/SC2/result:/opt/result:rw                #挂载中间文件和输出结果目录ports:- "9024:9024"                                                        #ssh连接端口可以按需修改environment:- TZ=Asia/Shanghai                                                   #设置时区- PS=20191124                                                        #修改默认ssh密码- PT=9024                                                            #修改默认ssh端口

基础环境运行

# docker-compose.yml 所在目录下运行
docker-compose up -d# 或者
docker-compose up -d -f /路径/docker-compose.yaml# 查看docker是否正常运行,docker-compose.yaml目录下运行
docker-compose ps# 或者
docker ps

docker 容器使用,类似于登录远程服务器

# 登录docker,使用的是ssh服务,可以本地或者远程部署使用
ssh root@192.168.6.6 -p9024# 看到如下,显示如下提示即正常登录
(base) root@SliverWorkstation:~#

三. 分析流程

  1. 变量设置:

    #样本编号
    export sn=SRR10971381
    #数据输入目录
    export data=/opt/data
    #数据输出、中间文件目录
    export result=/opt/result
    #conda安装的环境目录
    export envs=/root/mambaforge-pypy3/envs
    #设置可用线程数
    export threads=8
    
  2. 数据简单过滤:

    #conda检测环境是否存在,首次运行不存在创建该环境并安装软件
    if [ ! -d "${envs}/qc" ]; thenmamba env create -f /opt/config/qc.yaml
    fisource activate qcmkdir -p ${result}/${sn}/clean
    mkdir -p ${result}/${sn}/qcfastqc ${data}/SC2/${sn}_1.fastq.gz ${data}/SC2/${sn}_2.fastq.gz -o ${result}/${sn}/qcfastp -w ${threads} -i ${data}/SC2/${sn}_1.fastq.gz -I ${data}/SC2/${sn}_2.fastq.gz \-o ${result}/${sn}/clean/${sn}_1_clean.fastq.gz -O ${result}/${sn}/clean/${sn}_2_clean.fastq.gz \-h ${result}/${sn}/qc/${sn}_fastp.html -j ${result}/${sn}/qc/${sn}_fastp.json fastqc ${result}/${sn}/clean/${sn}_1_clean.fastq.gz ${result}/${sn}/clean/${sn}_2_clean.fastq.gz \-o ${result}/${sn}/qcmultiqc ${result}/${sn}/qc/ -f -o ${result}/${sn}/qcconda  deactivate
    
  3. Centrifuge 对序列进行物种鉴定

    #conda检测环境是否存在,首次运行不存在创建该环境并安装软件
    if [ ! -d "${envs}/centrifuge" ]; thenmamba env create -f /opt/config/centrifuge.yaml
    fisource activate centrifugeif [ ! -f "/opt/ref/centrifuge-idx/hvc.4.cf" ]; thenmkdir  -p /opt/ref/centrifuge-idxaria2c https://zenodo.org/record/3732127/files/h+v+c.tar.gz?download=1 -d /opt/ref/centrifuge-idxtar -zxvf /opt/ref/centrifuge-idx/h+v+c.tar.gz "/opt/ref/centrifuge-idx"
    ficentrifuge \-x /opt/ref/centrifuge-idx/hvc \-1 ${result}/${sn}/clean/${sn}_R1.fastq.gz \-2 ${result}/${sn}/clean/${sn}_R2.fastq.gz \--report-file ${result}/${sn}/${sn}.clean.report.tsv \-S ${result}/${sn}/${sn}.clean.result.tsv \-p ${threads}conda  deactivate
    
  4. Centrifuge输出结果转换为kraken格式,便于pavian交互式分析

    source activate centrifugecentrifuge-kreport \-x /opt/ref/centrifuge-idx/hvc \${result}/${sn}/${sn}.clean.result.tsv > ${result}/${sn}/${sn}.kraken2.report.tsvconda  deactivate
    
  5. pavian docker运行,配置docker-compose.yaml如下

    version: "3"
    services:pavian:image: florianbw/pavian:latestcontainer_name: pavianports:- "5000:80"
    

    运行docker镜像:docker-compose.yaml文件相同目录下运行:

    #运行docker镜像
    docker-compose up -d#查看docker容器运行情况,docker-compose.yaml相同目录下运行
    docker-compose ps#或者
    docker ps
    

    pavian容器运行起来之后,打开浏览器,地址栏输入http://localhost:5000,可以看到如下图:

  6. 点击右侧Browse按钮,上传输出文件SRR10971381.kraken2.report.tsv

  1. 点击左侧按钮可以看到图形化分析结果,比对上的16.2%;没比对上的83.8%

  2. 点击左侧Sample可以看到桑基图如下:Severe acute respiratory syndrome-related coronavirus 59.5k,结果很明显了。

  3. 可以点击左侧Generate HTML report导出该报告: Uploaded_sample_set-report.html

使用宏基因组的方法快速鉴定新冠病毒SARS-CoV2相关推荐

  1. 一文读懂测序技术在新冠病毒检测中的应用(文末附FAQ)

    来源:生物探索 随着世界疫情的发展,多个国家进入公共卫生紧急状态,全球科学家都在抓紧研究更好的检测.治疗.防控手段.从最初未知β属冠状病毒的快速鉴定到病毒序列的完整破译,再到病毒序列的变异监测,高通量 ...

  2. nanopore测序第12期培训班(含新冠病毒分析)开始报名

    2021年nanopore第12期培训班(线上)开始报名.本期主题为"nanopore测序基因组拼接数据分析".nanopore测序实时,快速,便携,长度长,高通量等诸多特点,特别 ...

  3. PBMC分离试剂盒-国内上市自测新冠病毒抗原试剂盒

    核酸检测需要借用机器,出结果等待时间长,而且排队检测的时候也有一定的感染风险.这个时候我们发现,仅靠核酸检测是不够的.新冠抗原检测产品是一种简易而快速的病毒检测手段,无需专业人员辅助,无需借助机器,在 ...

  4. 浙大团队研发铜基沸石纱布口罩,1分钟杀灭新冠病毒逾99%

    近日,浙江大学化学系范杰教授科研团队研制出能1分钟快速灭活新冠病毒的防护口罩,经浙江大学附属第一医院传染病诊治国家重点实验室测试,该口罩1分钟内新冠病毒灭活效率大于99%. "我们用自主研发 ...

  5. 最新研究!新冠病毒被定义为“大流行”背后,竟然还藏着这样凶险的大杀器?...

    全世界只有3.14 % 的人关注了 爆炸吧知识 你知道当一种疾病被定义为大流行(pandemic)时意味着什么吗? 大流行(pandemic) 是指一种疾病在短时间内越过省界国界甚至洲界在全世界范围内 ...

  6. 【3月30日直播】新冠病毒全基因组测序——Midnight试剂盒及整体解决方案

    识别上方二维码 或点击「阅读原文」 免费报名参加 新冠疫情肆虐全球,基于Nanopore测序技术和数据分析在全球感染性疾病防控中的优势充分显现出来.该平台使用灵活.操作简便.产出快速.分析实时等特征为 ...

  7. 北京“快速AI体温检测”应对返工潮;盖茨基金出资1亿美元抗击新冠病毒;腾讯再设2亿元资金池抗击疫情...

    返工潮即将到来,北京开始部署"快速 AI 体温检测仪" 2 月 10 日是国内各省市预计的复工时间.当前疫情引起了各地高度重视,为减少传播风险,北京很多街道和村镇已经开展了一段时间 ...

  8. 奖金600万美元的XPRIZE新冠病毒快速检测竞赛决出大奖获得者,以研制快速、大规模、低成本且简单易用的解决方案

    大赛呼吁全球创新者在疫情之下开发出有效而经济的新冠病毒检测工具 洛杉矶--(美国商业资讯)--通过设计和运营激励性竞赛来解决人类所面临重大挑战的全球领导者XPRIZE今天欣然公布了奖金高达600万美元 ...

  9. 阿联酋研发新冠病毒快速激光检测技术

    阿联酋阿布扎比--(美国商业资讯)--在阿布扎比证券交易所上市的International Holdings Company (IHC)旗下药物研究分支机构QuantLase Imaging Lab宣 ...

最新文章

  1. [云炬创业基础笔记]第七张创业资源测试14
  2. 易语言网盘服务器源码_使用使用rclone挂载OneDrive到服务器
  3. 为/tmp添加nodev/nosuid/noexec挂载选项
  4. JVM学习01—下载编译openjdk源码并进行调试
  5. Linux-Unix编程手册(上下两册全).pdf 高清原版
  6. mysql有rollup函数吗_MySQL-with rollup函数运用
  7. 【网络安全】加解密算法最详解
  8. 这些曾盛极一时的经典软件,现在再看,还是记忆犹新
  9. 科学计算机要用的电池是几号,科学计算器电池
  10. 加拿大MSB牌照简介
  11. oracle 左连接 简写,SQL左连接
  12. zz]Prisoners’ Dilemma Tit For Tat
  13. Word、Excel、PPT等图标异常解决方案
  14. 邓白氏编码官方查询地址
  15. .NET基础加强笔记
  16. php xmp,xmp1和2模式区别有哪些
  17. MATLAB傅里叶级数分解极其图像
  18. 半球展开图_新手入门如何学习钣金放样展开,老师傅分享篇(二)!
  19. GameFramework篇:Font texture for dynamic font MainFont is missing. Please reimport the Font. All dyna
  20. 新手小白学JAVA 分支结构 switch结构 for循环

热门文章

  1. Python乘法口诀
  2. Home键监听与电源键
  3. 数据标注工具下载中遇到的各种问题
  4. 逻辑思维、时间管理、学习记忆书单整理
  5. 计算机的基础知识(一)
  6. PubMed插件:分区、影响因子和即时IF一目了然,还能秒下文献(亲测有效)
  7. Encoded password does not look like BCrypt最新异常处理
  8. 6-8 Percolate Up and Down (20 分)【堆结点的插入与删除】
  9. 操作系统头歌实验四 文件系统
  10. 大厂面试必考题:三行布局之圣杯布局和双飞翼布局的区别