从头测序+重测序 | 利用细菌二/三代测序组装全基因组草图,注释,并应用于遗传分析...
这个问题部分地解决了:
仍存在的"Error"可能与原核特殊的密码子使用、基因组存在gap区、snpEff的进一步参数选择有关。
那么我们完成了什么?假设你分离到了一株菌,是一种当前研究地少、或新发现的物种,NCBI也无参考基因组,那么:
① 需要从头组装;
② 二代测序Reads太短,为了获得最大的contig或染色体,就可能需要加些三代测序数据;
③ 组装好了之后就要注释,获得能看得懂的基因名称(Symbol),并很清楚地了解其功能、掌握其序列;
④ 这株菌肯定有其特殊之处 (特殊性状),不然你关注不到它,也就是说,同一个物种,你很可能有另一些菌株看起来非常普通,那么你就有了一个"A set of strains"。经过基因组的比较之后,就发现了目标菌株的一些特殊序列 (例如:短的SNP/InDel,或长片段结构变异,无非就是这些),那么你就需要知道这些"变异"的影响效应,比如:是否为错义突变、是否移码、是否为"高影响",这时就需要用到snpEff等类似的程序 (ANNOVAR大概率只能搞人的。因为我们根本不关心欧洲细菌的"人群"变异频率,细菌里还没有这个概念),那么就需要用到基因组注释文件,如gff。
这样的研究(组装+遗传分析)具有很强的扩展性,因为从头测序和重测序分析都做了。细菌基因组很小,做这些工作至少从算力上看不在话下。
一个可以实现的有意思的目标是:我发现了一株新的、特殊的细菌,组装并注释了它,并发现其在xxx基因中存在的一段特殊序列,或一些SNP/InDel,具备了一种特殊的性状 (降解塑料、固氮、耐药、或致病),可能具有重要的研究价值。
当然也可以做一些进化、溯源、代谢、毒力等分析,甚至用自己的名字给它命名,毕竟你把这个菌的所有序列都展示并注释了。
https://doi.org/10.1016/j.tube.2020.102015
往期精品(点击图片直达文字对应教程)
机器学习
后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集
从头测序+重测序 | 利用细菌二/三代测序组装全基因组草图,注释,并应用于遗传分析...相关推荐
- 【生信】第一二三代测序技术原理的理解
[生信]第一二三代测序技术原理的理解 本文部分图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用. 目录 [生信]第一二三代测序技术原理的理解 1.了解什么是DNA测序,什么是RNA测序 ...
- 宏基因组数据二+三代混合组装并计算Read对Contig的深度
二+三代混合组装:OPERA-MS 对于我这一批样品,分别使用了Illumina NovaSeq PE250.插入文库约400bp的双端测序,另外对于每一组平行样进行了Oxford Nanopore的 ...
- 基于三代测序技术的微生物组学研究进展
基于三代测序技术的微生物组学研究进展 2020-09-04 09:16 微生物通常指一切难以用肉眼观察到的微小生物, 包括细菌.病毒.古菌.真菌以及一些微小的原生生物.微生物体积微小.结构简单, 却又 ...
- 生物信息学——基础篇:一至三代测序技术
生物信息学 生物信息学--基础篇:一至三代测序技术 文章目录 生物信息学 一.一代测序 二.二代测序 三.三代测序 四.总结 一.一代测序 概述:一代测序(又称Sanger测序). 原理:Sanger ...
- 三代测序数据纠错的方法、装置和计算机可读存储介质与流程
三代测序数据纠错的方法.装置和计算机可读存储介质与流程 文档序号:15616049发布日期:2018-10-09 21:24 导航: X技术> 最新专利>计算;推算;计数设备的制造及其应用 ...
- 一代二代三代测序的基本原理及区别是啥啊?
illumina和pacbio的基本原理就是改造碱基,每个碱基加上不同颜色的发光基团. 测序的时候边合成边测序.和你的测序链ATGC配对完以后,配对合成好的碱基就把发光基团丢出去了,然后这个孔就会发出 ...
- 大数据时代千帆竞发,三代测序激流勇进
大数据时代千帆竞发,三代测序激流勇进 2021-08-20 11:09 21世纪是生物的世纪,也是基因科技蓬勃发展和被广泛应用的世纪,每一代基因测序技术,无一例外地伴随着核心工具的变革和新应用场景的产 ...
- 三代测序数据超快组装软件--大牛Li heng 力作
三代测序数据超快组装软件--大牛Li heng 力作 (2017-06-19 16:53:46) 转载▼ 分类: 三代 1:软件链接:https://github.com/lh3/miniasm ...
- 使用Canu对三代测序进行基因组组装
Canu简介 Canu是Celera的继任者,能用于组装PacBio和Nanopore两家公司得到的测序结果. Canu分为三个步骤,纠错,修整和组装,每一步都差不多是如下几个步骤: 加载read到r ...
最新文章
- MySQL 为什么表的数据删除一般,表文件大小不变?
- Mac怎么不能拷贝文件到U盘
- C++描述杭电OJ 2005.第几天? ||
- Collection中list集合的应用常见的方法
- java课程课后作业190502之单词统计续集
- linux系统生成的新文件是什么编码的,Linux系统的默认编码怎样设置?
- 图片保存到数据库和从数据库读取图片并显示(C#)
- allt什么意思_Allt是什么意思
- 电脑运行c语言时错误,电脑出现microsoft visual c++ runtime error 解决方法(多图)
- mysql 中用select建表_用 SELECT 的结果创建表
- Python读写修改Shapefile
- wps的ppt如何去掉插入表格的表头与表体之间的空白间隔
- mysql免安装部署_MySQL免安装版配置部署
- 如何更改VS的项目名字
- 上证指数(000001)股票历史数据,下载上证指数(000001历史数据
- 孟岩亮相TokenSky,首谈通证的多维、多阶、多态体系
- PowerPoint 教程:如何在 PowerPoint 中从大纲创建演示文稿?
- 站在数字经济浪尖:360视觉云探路中小微企业数智转型
- 前端之HTML基础扫盲
- ping pong buffer
热门文章
- OpenWrt R20.10.20 / LuCI Master (git-20.256.12360-1a54222) 不能访问内网网址
- SEVERE: Error configuring application listener of class org.springframework.web.context.ContextLoade
- 心理学史【0015】
- 数据结构 C 代码 3.5: 汉诺塔问题
- linux 看当前目录,Linux下 查看当前目录的所有文件
- SEOER该如何看待搜搜搜狗联合?
- STM32基于W5500模块实现通信
- Java中数组与List的区别
- php 数组 指针,PHP数组指针操作
- 爬取12306余票信息返回“网络可能存在问题,请您重试一下!”