这个问题部分地解决了:

仍存在的"Error"可能与原核特殊的密码子使用、基因组存在gap区、snpEff的进一步参数选择有关。

那么我们完成了什么?假设你分离到了一株菌,是一种当前研究地少、或新发现的物种,NCBI也无参考基因组,那么:

① 需要从头组装

② 二代测序Reads太短,为了获得最大的contig或染色体,就可能需要加些三代测序数据;

③ 组装好了之后就要注释,获得能看得懂的基因名称(Symbol),并很清楚地了解其功能、掌握其序列

④ 这株菌肯定有其特殊之处 (特殊性状),不然你关注不到它,也就是说,同一个物种,你很可能有另一些菌株看起来非常普通,那么你就有了一个"A set of strains"。经过基因组的比较之后,就发现了目标菌株的一些特殊序列 (例如:短的SNP/InDel,或长片段结构变异,无非就是这些),那么你就需要知道这些"变异"的影响效应,比如:是否为错义突变、是否移码、是否为"高影响",这时就需要用到snpEff等类似的程序 (ANNOVAR大概率只能搞人的。因为我们根本不关心欧洲细菌的"人群"变异频率,细菌里还没有这个概念),那么就需要用到基因组注释文件,如gff。

这样的研究(组装+遗传分析)具有很强的扩展性,因为从头测序重测序分析都做了。细菌基因组很小,做这些工作至少从算力上看不在话下。

一个可以实现的有意思的目标:我发现了一株新的、特殊的细菌,组装并注释了它,并发现其在xxx基因中存在的一段特殊序列,或一些SNP/InDel,具备了一种特殊的性状 (降解塑料、固氮、耐药、或致病),可能具有重要的研究价值。

当然也可以做一些进化、溯源、代谢、毒力等分析,甚至用自己的名字给它命名,毕竟你把这个菌的所有序列都展示并注释了。

https://doi.org/10.1016/j.tube.2020.102015

往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

从头测序+重测序 | 利用细菌二/三代测序组装全基因组草图,注释,并应用于遗传分析...相关推荐

  1. 【生信】第一二三代测序技术原理的理解

    [生信]第一二三代测序技术原理的理解 本文部分图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用. 目录 [生信]第一二三代测序技术原理的理解 1.了解什么是DNA测序,什么是RNA测序 ...

  2. 宏基因组数据二+三代混合组装并计算Read对Contig的深度

    二+三代混合组装:OPERA-MS 对于我这一批样品,分别使用了Illumina NovaSeq PE250.插入文库约400bp的双端测序,另外对于每一组平行样进行了Oxford Nanopore的 ...

  3. 基于三代测序技术的微生物组学研究进展

    基于三代测序技术的微生物组学研究进展 2020-09-04 09:16 微生物通常指一切难以用肉眼观察到的微小生物, 包括细菌.病毒.古菌.真菌以及一些微小的原生生物.微生物体积微小.结构简单, 却又 ...

  4. 生物信息学——基础篇:一至三代测序技术

    生物信息学 生物信息学--基础篇:一至三代测序技术 文章目录 生物信息学 一.一代测序 二.二代测序 三.三代测序 四.总结 一.一代测序 概述:一代测序(又称Sanger测序). 原理:Sanger ...

  5. 三代测序数据纠错的方法、装置和计算机可读存储介质与流程

    三代测序数据纠错的方法.装置和计算机可读存储介质与流程 文档序号:15616049发布日期:2018-10-09 21:24 导航: X技术> 最新专利>计算;推算;计数设备的制造及其应用 ...

  6. 一代二代三代测序的基本原理及区别是啥啊?

    illumina和pacbio的基本原理就是改造碱基,每个碱基加上不同颜色的发光基团. 测序的时候边合成边测序.和你的测序链ATGC配对完以后,配对合成好的碱基就把发光基团丢出去了,然后这个孔就会发出 ...

  7. 大数据时代千帆竞发,三代测序激流勇进

    大数据时代千帆竞发,三代测序激流勇进 2021-08-20 11:09 21世纪是生物的世纪,也是基因科技蓬勃发展和被广泛应用的世纪,每一代基因测序技术,无一例外地伴随着核心工具的变革和新应用场景的产 ...

  8. 三代测序数据超快组装软件--大牛Li heng 力作

    三代测序数据超快组装软件--大牛Li heng 力作 (2017-06-19 16:53:46) 转载▼   分类: 三代 1:软件链接:https://github.com/lh3/miniasm ...

  9. 使用Canu对三代测序进行基因组组装

    Canu简介 Canu是Celera的继任者,能用于组装PacBio和Nanopore两家公司得到的测序结果. Canu分为三个步骤,纠错,修整和组装,每一步都差不多是如下几个步骤: 加载read到r ...

最新文章

  1. MySQL 为什么表的数据删除一般,表文件大小不变?
  2. Mac怎么不能拷贝文件到U盘
  3. C++描述杭电OJ 2005.第几天? ||
  4. Collection中list集合的应用常见的方法
  5. java课程课后作业190502之单词统计续集
  6. linux系统生成的新文件是什么编码的,Linux系统的默认编码怎样设置?
  7. 图片保存到数据库和从数据库读取图片并显示(C#)
  8. allt什么意思_Allt是什么意思
  9. 电脑运行c语言时错误,电脑出现microsoft visual c++ runtime error 解决方法(多图)
  10. mysql 中用select建表_用 SELECT 的结果创建表
  11. Python读写修改Shapefile
  12. wps的ppt如何去掉插入表格的表头与表体之间的空白间隔
  13. mysql免安装部署_MySQL免安装版配置部署
  14. 如何更改VS的项目名字
  15. 上证指数(000001)股票历史数据,下载上证指数(000001历史数据
  16. 孟岩亮相TokenSky,首谈通证的多维、多阶、多态体系
  17. PowerPoint 教程:如何在 PowerPoint 中从大纲创建演示文稿?
  18. 站在数字经济浪尖:360视觉云探路中小微企业数智转型
  19. 前端之HTML基础扫盲
  20. ping pong buffer

热门文章

  1. OpenWrt R20.10.20 / LuCI Master (git-20.256.12360-1a54222) 不能访问内网网址
  2. SEVERE: Error configuring application listener of class org.springframework.web.context.ContextLoade
  3. 心理学史【0015】
  4. 数据结构 C 代码 3.5: 汉诺塔问题
  5. linux 看当前目录,Linux下 查看当前目录的所有文件
  6. SEOER该如何看待搜搜搜狗联合?
  7. STM32基于W5500模块实现通信
  8. Java中数组与List的区别
  9. php 数组 指针,PHP数组指针操作
  10. 爬取12306余票信息返回“网络可能存在问题,请您重试一下!”