宏基因组测序在新发腹泻病毒鉴定中的应用

撰文:李杰 常熟理工学院生物与食品工程学院
责编:刘永鑫 中科院遗传发育所

写在前面

发现和鉴定新病毒以及确定新病毒与疾病的关系是预防、诊断和治疗新发病毒性传染病的首要任务。高通量测序技术突破了传统技术方法的局限,可以直接以标本中所有的遗传物质为研究对象,从而能够快速地鉴定出标本中存在的病毒,形成了一门研究特定环境中病毒群落的新兴学科:病毒宏基因组学(宏病毒组)

传统意义上有很多用于发现新病毒的方法,如病毒分离、核酸检验、血清学试验等,但它们都有一定的局限性。但利用高通量测序发现新病毒具有信息量大、对标本所含信息无偏倚、操作较简单、检测成本较低等独特优点,使得该技术已成为目前病毒发现中最为重要的技术之一,其在病毒诊断、溯源、预警等方面具有实用意义。本文以2017年发表在《Emerging Infectious Diseases 》(IF 7.42 )上的一篇文章为例来做简单介绍。

背景

2010年入冬以来,猪流行性腹泻病毒(PEDV)变异株开始在我国流行,并导致全国范围内的严重爆发,初生仔猪感染后死亡率达90%以上; 随后,可导致仔猪腹泻的新型肠道冠状病毒Delta冠状病毒(PDCoV)也被发现;冠状病毒的高变异特性目前已经成为仔猪腹泻防控的难点,给养猪业造成巨大经济损失,对养猪业的发展形成严重威胁。2017年初开始,广东部分猪场先后暴发免疫猪群新生仔猪腹泻、死亡的案例,临床发病比PEDV稍晚、死亡率稍低,实验室检测排除了常见的几种猪腹泻相关病毒感染。

研究方法

病料收集与反饲

采集来自三个猪场的32头生病仔猪排泄物用于检测常规的猪腹泻相关病毒和进行反饲实验。将20头5日龄仔猪分为四组,每组五头,其中三组实验组分别饲喂采集自三个猪场的病猪排泄物,每头饲喂5ml排泄物,一组作为对照。在接种后三天和五天每组分别剖杀2头猪进行尸检。

文库构建

将剖杀仔猪的小肠及肠道内容物制成匀浆并进行过滤,取上清用于RNA提取。提取的RNA在进行去除DNA和核糖体RNA后,通过体外随机引物反转录进行建库,测序在Illumina HiSeq平台进行。

图1 基于鸟枪法的宏转录组测序流程示意图

(A)样本收集

(B)样本的初步处理

(C)标本核酸的提取

(D)测序文库的构建

(E)高通量测序

(F)测序序列的信息分析

基因组组装

首先对测序获得的150 bp长度的双端测序序列进行质量控制后,利用短序列比对软件bwa将其比对到宿主参考基因组(susScr3)上,将未匹配的序列筛选出来。再利用wgs-assembler软件将未匹配的序列进行基因组拼接,产生unitigs。随后挑选组成序列数目较多的unitigs提交到NCBI进行blast序列匹配,寻找出潜在亲缘关系较近的可参考基因组,以其为参照将序列匹配到基因组上。最后利用samtools和bcftools将匹配信息生成为最终病原的基因组序列。

图2 基于宏转录组测序鉴定病原及基因组组装流程

基因组注释

获得的病毒全基因组序列通过在ORF finder网站(https://www.ncbi.nlm.nih.gov/orffinder/) 进行在线的开放阅读框预测,查找潜在的蛋白编码片段。我们设定最小的开放阅读框大小为150 bp,并忽略嵌套存在的开放阅读框,其他为默认参数设置。

研究结果

使用二代测序数据质量质控软件cutadapt 1.9.1对测序原始数据去除接头以及低质量序列等,得到后续可用序列170,654,027条干净数据,平均读长为125 bp,Q20以上的数据比例为96%左右。其中99.5%的序列通过短序列比对软件bwa可以比对到猪的参考基因组susScr3上

将不能匹配到宿主基因组上的0.5%的序列筛选出来,其中相当一部分可能是疑似病原的序列。我们将这些序列利用wgs-assembler软件进行拼接,共获得了131,070个拼接片段。借助在线的BLAST分析,发现其中一部分拼接片段(3%左右)与HKU2病毒相似性较高。我们以HKU2/GD/430/2006株的基因组作为参考基因组(Lau et al. 2007),将序列进行匹配,最终可以有效覆盖基因组的98.3%,覆盖度为1051X。利用samtools软件我们生成了初始的疑似病原基因组序列。目前该全基因组序列已经提交到NCBI数据库(MF167434),我们将该病毒命名为猪肠道Alpha冠状病毒(PEAV)。在不计算其3’末端多聚腺苷酸尾巴的情况下,其全长为27,171 nt。

通过ORF finder软件对PEAV基因组进行开放阅读框预测,发现了10个可能的阅读框,包括ORF1a, ORF1b, S, E, M, N, NS3, NS7a等(图3)。其注释的ORF信息与HKU2比较类似,除了ORF3和ORF10外。共有的开放阅读框序列的核苷酸相似性为80%到98%,氨基酸相似性为87%到100%。

图3 PEAV基因组结构示意图

PEAV的结构蛋白与HKU2有比较好的序列相似性。其中S蛋白的相似性较低,核苷酸相似性只有80%,氨基酸相似性有87%。而其他的结构蛋白相似性比较高,核苷酸相似性有93%~98%,氨基酸相似性有94%~100%。非结构蛋白的相似性略低,其中NS3和NS7a的核苷酸相似性为89%~90%,氨基酸相似性为89%~94%。

Reference

  1. Lang Gong, Jie Li, Qingfeng Zhou, Zhichao Xu, Li Chen, Yun Zhang, Chunyi Xue, Zhifen Wen, Yongchang Cao. A New Bat-HKU2–like Coronavirus in Swine, China, 2017. Emerging Infectious Diseases, 2017, 23(9): 1607-1609
    https://wwwnc.cdc.gov/eid/article/23/9/17-0915_article PDF: https://wwwnc.cdc.gov/eid/article/23/9/pdfs/17-0915.pdf

作者简介

李杰,中山大学生物信息学博士、博士后,现任职常熟理工学院生物与食品工程学院讲师。研究领域涉及微生物基因组组装、宏基因组学、畜禽流行性疾病的流行病学、病毒与宿主相互作用、病毒遗传演化、新发病毒的分离与鉴定等。目前主持苏州市科技项目和江苏省自然科学基金青年项目各一项,获得广东省“扬帆计划”博士后扶持项目两项,参与国家自然科学基金青年项目一项。参与发表SCI论文15篇,其中第一/共同第一作者8篇。

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

EID:宏基因组测序在新发腹泻病毒鉴定中的应用相关推荐

  1. 一作解读:EID-2017-宏基因组测序在新发腹泻病毒鉴定中的应用

    文章目录 宏基因组测序在新发腹泻病毒鉴定中的应用 写在前面 背景 研究方法 病料收集与反饲 文库构建 基因组组装 基因组注释 研究结果 Reference 作者简介 猜你喜欢 写在后面 宏基因组测序在 ...

  2. EID-:宏病毒组技术在新发腹泻病毒鉴定中的应用

    宏基因组测序在新发腹泻病毒鉴定中的应用 撰文:李杰 常熟理工学院生物与食品工程学院 责编:刘永鑫 中科院遗传发育所 写在前面 发现和鉴定新病毒以及确定新病毒与疾病的关系是预防.诊断和治疗新发病毒性传染 ...

  3. 内蒙古农大孙志宏教授证实超深度混合宏基因组测序能够对人类肠道微生物组中的低丰度物种进行基因组和功能表征...

    导读 人类肠道微生物群中已经发现了大量微生物基因组,但由于目前大多数研究中使用的测序深度相对较浅,在个体水平上了解低丰度物种的作用仍具有挑战.为了提高基因组的组装性能,本研究采用了Illumina H ...

  4. 易基因 - 组学前沿:癌症组织和血液的宏基因组测序揭示了细菌、病毒和癌症之间的新联系|文献科普

    易点评 癌症可能是由于宿主组织被细菌和病毒感染所诱发的.而这类致癌过程背后的机制主要有两类:一类是病毒将自身遗传物质整合到宿主基因组中从而导致致癌病毒蛋白的表达,而另一类则是细菌所导致的慢性炎症引发的 ...

  5. ISME | 通过长读长宏基因组测序揭示南极土壤未培养细菌的生物合成潜力

    关注我们 一起探索微生物领域的奥妙 摘要 日趋严重的抗生素抗性问题使得研究者们将目光转移到可能是新的抗生素来源的未培养细菌上.扩增子测序与短读测序分析表明宏基因组中存在多样化的生物合成基因簇(BGC) ...

  6. Nature综述:宏基因组测序研究耐药基因的方法和资源

    本文转自红皇后学术,链接 https://mp.weixin.qq.com/s/2QMrq6hwr4mIPSpe_rfXJg 论文信息 论文题目:Sequencing-based methods an ...

  7. Nature:基于宏基因组测序构建人类肠道微生物组参考基因集

    文章目录 基于宏基因组测序构建人类肠道微生物组参考基因集 文章影响 作者简介 热心肠日报 摘要 正文 宏基因组测序肠道微生物组 图1. 人类肠道微生物组的覆盖度 人类肠道微生物组的基因集 图2. 预测 ...

  8. mSystem:鸟枪法宏基因组测序之外我们还能做什么

    文章目录 鸟枪法宏基因组测序之外 摘要 关键词 前言 耦合稳定性同位素示踪与基因组分辨的宏基因组学 靶向探索"微型宏基因组" 链接可移动元件与微生物宿主 Reference 猜你喜 ...

  9. 高分文章精选 | 纳米孔宏基因组测序的表现

    在宏基因组测序中,纳米孔长读长可从复杂多样的宏基因组学样本中组装完整的闭环细菌基因组和质粒,提供无偏倚.免PCR扩增的基因组序列.已有越来越多的科学家使用纳米孔长读长来区分近缘物种,解析具有挑战性的重 ...

最新文章

  1. 【一】TSP、VRP、VRP模型介绍
  2. 北京工商大学计算机学院研究生院,北京工商大学计算机学院
  3. java接口示例_【基础篇】java-接口及其示例
  4. 使用ReportNG更好看的TestNG HTML测试报告– Maven指南
  5. 我想做产品,实现一个非常优秀的电脑桌面记事本加闹钟
  6. 查询oracle历史scn,ORACLE中的各种SCN查询
  7. AcWing 852. spfa判断负环(spfa or bellman)
  8. wenbao与cf整数直角三角形
  9. 三菱fx2n64mr说明书_三菱FX2N-64MR-D编程手册(FX系列可编程控制器) - 三菱
  10. 海康威视NVR萤石云配置及不在线故障排除
  11. Unity Webm格式视频报错
  12. 拼多多商家有效评价是什么意思?拼多多的评价被屏蔽的原因有哪些呢?
  13. python删除重复文件
  14. 《算法竞赛进阶指南》荷马史诗
  15. android google map
  16. chrome插件(Markdown Nice):用 markdown 写微信公众号
  17. 离线强化学习(Offline RL)系列3: (算法篇)策略约束 - BRAC算法原理详解与实现(经验篇)
  18. python财务编程_Python笔记 财务小白的 day4 python编程基础(2)
  19. LibreCAD环境配置
  20. 5 机器学习 朴素贝叶斯算法 高斯模型 多项式模型 伯努利模型 拉普拉普平滑系数 TfidfVectorizer

热门文章

  1. 什么?Redis 的 QPS 是 MySQL 的 100 倍?
  2. 为什么“不懂数据结构与算法”的程序员一定走不远?
  3. 彼之蜜糖,吾之砒霜——聊聊软件开发中的最佳实践
  4. 作为领导,如何提升自己的管理能力?
  5. 视频会议已成为武汉新趋势,在未来,线上会议有机会成为「主流」会议模式吗?
  6. sqlite3 unicode转中文
  7. Linux Ethercat主站
  8. tidb mysql登录_TiDB 忘记密码如何登陆
  9. 类和JSON的序列化与反序列化
  10. 计算机书籍-机器学习导论(原书第2版)