文章目录

  • 宏基因组测序在新发腹泻病毒鉴定中的应用
    • 写在前面
    • 背景
    • 研究方法
      • 病料收集与反饲
      • 文库构建
      • 基因组组装
      • 基因组注释
    • 研究结果
    • Reference
    • 作者简介
    • 猜你喜欢
    • 写在后面

宏基因组测序在新发腹泻病毒鉴定中的应用

撰文:李杰 常熟理工学院生物与食品工程学院
责编:刘永鑫 中科院遗传发育所

写在前面

发现和鉴定新病毒以及确定新病毒与疾病的关系是预防、诊断和治疗新发病毒性传染病的首要任务。高通量测序技术突破了传统技术方法的局限,可以直接以标本中所有的遗传物质为研究对象,从而能够快速地鉴定出标本中存在的病毒,形成了一门研究特定环境中病毒群落的新兴学科:病毒宏基因组学(宏病毒组)

传统意义上有很多用于发现新病毒的方法,如病毒分离、核酸检验、血清学试验等,但它们都有一定的局限性。但利用高通量测序发现新病毒具有信息量大、对标本所含信息无偏倚、操作较简单、检测成本较低等独特优点,使得该技术已成为目前病毒发现中最为重要的技术之一,其在病毒诊断、溯源、预警等方面具有实用意义。本文以2017年发表在《Emerging Infectious Diseases 》(IF 7.42 )上的一篇文章为例来做简单介绍。

背景

2010年入冬以来,猪流行性腹泻病毒(PEDV)变异株开始在我国流行,并导致全国范围内的严重爆发,初生仔猪感染后死亡率达90%以上; 随后,可导致仔猪腹泻的新型肠道冠状病毒Delta冠状病毒(PDCoV)也被发现;冠状病毒的高变异特性目前已经成为仔猪腹泻防控的难点,给养猪业造成巨大经济损失,对养猪业的发展形成严重威胁。2017年初开始,广东部分猪场先后暴发免疫猪群新生仔猪腹泻、死亡的案例,临床发病比PEDV稍晚、死亡率稍低,实验室检测排除了常见的几种猪腹泻相关病毒感染。

研究方法

病料收集与反饲

采集来自三个猪场的32头生病仔猪排泄物用于检测常规的猪腹泻相关病毒和进行反饲实验。将20头5日龄仔猪分为四组,每组五头,其中三组实验组分别饲喂采集自三个猪场的病猪排泄物,每头饲喂5ml排泄物,一组作为对照。在接种后三天和五天每组分别剖杀2头猪进行尸检。

文库构建

将剖杀仔猪的小肠及肠道内容物制成匀浆并进行过滤,取上清用于RNA提取。提取的RNA在进行去除DNA和核糖体RNA后,通过体外随机引物反转录进行建库,测序在Illumina HiSeq平台进行。

图1 基于鸟枪法的宏转录组测序流程示意图

(A)样本收集

(B)样本的初步处理

©标本核酸的提取

(D)测序文库的构建

(E)高通量测序

(F)测序序列的信息分析

基因组组装

首先对测序获得的150 bp长度的双端测序序列进行质量控制后,利用短序列比对软件bwa将其比对到宿主参考基因组(susScr3)上,将未匹配的序列筛选出来。再利用wgs-assembler软件将未匹配的序列进行基因组拼接,产生unitigs。随后挑选组成序列数目较多的unitigs提交到NCBI进行blast序列匹配,寻找出潜在亲缘关系较近的可参考基因组,以其为参照将序列匹配到基因组上。最后利用samtools和bcftools将匹配信息生成为最终病原的基因组序列。

图2 基于宏转录组测序鉴定病原及基因组组装流程

基因组注释

获得的病毒全基因组序列通过在ORF finder网站(https://www.ncbi.nlm.nih.gov/orffinder/) 进行在线的开放阅读框预测,查找潜在的蛋白编码片段。我们设定最小的开放阅读框大小为150 bp,并忽略嵌套存在的开放阅读框,其他为默认参数设置。

研究结果

使用二代测序数据质量质控软件cutadapt 1.9.1对测序原始数据去除接头以及低质量序列等,得到后续可用序列170,654,027条干净数据,平均读长为125 bp,Q20以上的数据比例为96%左右。其中99.5%的序列通过短序列比对软件bwa可以比对到猪的参考基因组susScr3上

将不能匹配到宿主基因组上的0.5%的序列筛选出来,其中相当一部分可能是疑似病原的序列。我们将这些序列利用wgs-assembler软件进行拼接,共获得了131,070个拼接片段。借助在线的BLAST分析,发现其中一部分拼接片段(3%左右)与HKU2病毒相似性较高。我们以HKU2/GD/430/2006株的基因组作为参考基因组(Lau et al. 2007),将序列进行匹配,最终可以有效覆盖基因组的98.3%,覆盖度为1051X。利用samtools软件我们生成了初始的疑似病原基因组序列。目前该全基因组序列已经提交到NCBI数据库(MF167434),我们将该病毒命名为猪肠道Alpha冠状病毒(PEAV)。在不计算其3’末端多聚腺苷酸尾巴的情况下,其全长为27,171 nt。

通过ORF finder软件对PEAV基因组进行开放阅读框预测,发现了10个可能的阅读框,包括ORF1a, ORF1b, S, E, M, N, NS3, NS7a等(图3)。其注释的ORF信息与HKU2比较类似,除了ORF3和ORF10外。共有的开放阅读框序列的核苷酸相似性为80%到98%,氨基酸相似性为87%到100%。

图3 PEAV基因组结构示意图

PEAV的结构蛋白与HKU2有比较好的序列相似性。其中S蛋白的相似性较低,核苷酸相似性只有80%,氨基酸相似性有87%。而其他的结构蛋白相似性比较高,核苷酸相似性有93%~98%,氨基酸相似性有94%~100%。非结构蛋白的相似性略低,其中NS3和NS7a的核苷酸相似性为89%~90%,氨基酸相似性为89%~94%。

Reference

  1. Lang Gong, Jie Li, Qingfeng Zhou, Zhichao Xu, Li Chen, Yun Zhang, Chunyi Xue, Zhifen Wen, Yongchang Cao. A New Bat-HKU2–like Coronavirus in Swine, China, 2017. Emerging Infectious Diseases, 2017, 23(9): 1607-1609
    https://wwwnc.cdc.gov/eid/article/23/9/17-0915_article PDF: https://wwwnc.cdc.gov/eid/article/23/9/pdfs/17-0915.pdf

作者简介

李杰,中山大学生物信息学博士、博士后,现任职常熟理工学院生物与食品工程学院讲师。研究领域涉及微生物基因组组装、宏基因组学、畜禽流行性疾病的流行病学、病毒与宿主相互作用、病毒遗传演化、新发病毒的分离与鉴定等。目前主持苏州市科技项目和江苏省自然科学基金青年项目各一项,获得广东省“扬帆计划”博士后扶持项目两项,参与国家自然科学基金青年项目一项。参与发表SCI论文15篇,其中第一/共同第一作者8篇。

猜你喜欢

  • 10000+: 菌群分析
    宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑
  • 系列教程:微生物组入门 Biostar 微生物组 宏基因组
  • 专业技能:生信宝典 学术图表 高分文章 不可或缺的人
  • 一文读懂:宏基因组 寄生虫益处 进化树
  • 必备技能:提问 搜索 Endnote
  • 文献阅读 热心肠 SemanticScholar Geenmedical
  • 扩增子分析:图表解读 分析流程 统计绘图
  • 16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
  • 在线工具:16S预测培养基 生信绘图
  • 科研经验:云笔记 云协作 公众号
  • 编程模板: Shell R Perl
  • 生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

一作解读:EID-2017-宏基因组测序在新发腹泻病毒鉴定中的应用相关推荐

  1. EID:宏基因组测序在新发腹泻病毒鉴定中的应用

    宏基因组测序在新发腹泻病毒鉴定中的应用 撰文:李杰 常熟理工学院生物与食品工程学院 责编:刘永鑫 中科院遗传发育所 写在前面 发现和鉴定新病毒以及确定新病毒与疾病的关系是预防.诊断和治疗新发病毒性传染 ...

  2. 内蒙古农大孙志宏教授证实超深度混合宏基因组测序能够对人类肠道微生物组中的低丰度物种进行基因组和功能表征...

    导读 人类肠道微生物群中已经发现了大量微生物基因组,但由于目前大多数研究中使用的测序深度相对较浅,在个体水平上了解低丰度物种的作用仍具有挑战.为了提高基因组的组装性能,本研究采用了Illumina H ...

  3. 易基因 - 组学前沿:癌症组织和血液的宏基因组测序揭示了细菌、病毒和癌症之间的新联系|文献科普

    易点评 癌症可能是由于宿主组织被细菌和病毒感染所诱发的.而这类致癌过程背后的机制主要有两类:一类是病毒将自身遗传物质整合到宿主基因组中从而导致致癌病毒蛋白的表达,而另一类则是细菌所导致的慢性炎症引发的 ...

  4. 随机宏基因组测序数据质量控制和去宿主的分析流程和常见问题

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议点击文末阅读原文 ...

  5. Nature综述:宏基因组测序研究耐药基因的方法和资源

    本文转自红皇后学术,链接 https://mp.weixin.qq.com/s/2QMrq6hwr4mIPSpe_rfXJg 论文信息 论文题目:Sequencing-based methods an ...

  6. Nature:基于宏基因组测序构建人类肠道微生物组参考基因集

    文章目录 基于宏基因组测序构建人类肠道微生物组参考基因集 文章影响 作者简介 热心肠日报 摘要 正文 宏基因组测序肠道微生物组 图1. 人类肠道微生物组的覆盖度 人类肠道微生物组的基因集 图2. 预测 ...

  7. iMeta | 大连海洋大学傅松哲和根特大学杨倩开发宏基因组测序和流式细胞术相结合的工作流程...

    点击蓝字 关注我们 宏基因组测序结合流式细胞术为城市污水中细菌病原体的微生物风险评估提供了新的框架 原文链接DOI: https://doi.org/10.1002/imt2.77 COMMENTAR ...

  8. ISME | 通过长读长宏基因组测序揭示南极土壤未培养细菌的生物合成潜力

    关注我们 一起探索微生物领域的奥妙 摘要 日趋严重的抗生素抗性问题使得研究者们将目光转移到可能是新的抗生素来源的未培养细菌上.扩增子测序与短读测序分析表明宏基因组中存在多样化的生物合成基因簇(BGC) ...

  9. databasemetadata获取表注释_宏基因组测序中短序列的注释

    宏基因组中短序列的注释是理解测序微生物群落潜在功能的重要步骤之一.单纯利用局部匹配的注释容易混淆那些蛋白同源性且局部序列非常相似的序列,进而不能真实准确反映复杂蛋白质家族中多变的结构和功能域. 今天我 ...

最新文章

  1. MySQL基本了解与使用
  2. Vue Router路由嵌套
  3. python中remove函数是什么意思,python中pop函数和remove函数有什么区别
  4. linux-linux top 命令各参数详解
  5. java反射随意值_Java反射笔记
  6. 图的遍历算法【数据结构F】
  7. Python try/except/finally等
  8. Kinect for Windows SDK开发初体验(二)操作Camera
  9. supervisor+gunicorn部署python web项目
  10. docker-compose 使用
  11. 系统学习Java语言的15个网站
  12. Matlab中grid 的使用
  13. 小程序 饿了么美团外卖券返利小程序源码+教程
  14. 【水晶报表内功心法】--公式、函数与运行时总计 注:(文章来自阿泰博客)
  15. 【Rust日报】2020-01-27 QIP:Rust中的量子计算模拟
  16. JS的onload事件
  17. 利用爬虫获取免费IP代理
  18. 【科研论文】Endnote入门指南
  19. 用户画像 用户画像表
  20. api c语言 播放视频,使用OpenCV播放视频文件(C/C++ API比较)

热门文章

  1. 业务库负载翻了百倍,我做了什么来拯救MySQL架构?
  2. 技术人员关注的几个优质公众号
  3. 值得收藏!7个值得下载的软件,让人大开眼界!
  4. Scrum看板工具Leangoo脑图实现影响地图
  5. 谷歌内部考核制度OKR是怎么样的?你会用OKR吗?
  6. 常见字符串和数值间得转换
  7. <utility><xutility>模板常见操作方法
  8. Python的控制语句1
  9. 非递归二叉树先序遍历,一个深拷贝引发的bug
  10. 关于MVC与三层架构、个人总结网上杂七杂八得出的最终成果、asp.net (core) MVC、JavaWeb的MVC