基因测序, 适可而止, 否则就是误区, 原因有:
1, 基因的修饰
2, 基因的整体效应
3, 基因的个体背景
4,基因间相互作用。
5 , 基因的时效性

等等, 都不是简单的测序可以解决的, 国内华大的方向有误, 不推崇

因为远没有饱和啊。
理想的研究状态 每个生物样品都要测序,且要3个以上的重复。现在许多物种都只测了参考基因组,更多的物种都没测完,更别说你想一次实验几百个上千的样品单独测序了。

这还只是基因组DNA水平上的测序。甲基化,转录组,蛋白组,小RNA各种各样都要测序。

作者:Dontkme
链接:https://www.zhihu.com/question/19929018/answer/67375185
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

作者:Tang Boyun
链接:https://www.zhihu.com/question/19929018/answer/67354231
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

目前已有序列数据(并不是完整基因组数据)的动物分布:

其实很多物种的基因组还没测,目前不存在测了又测,所以这个问题我把范围缩减在:为何人的基因组测了又测上。

首先要明白,一个基因组拼完后,得到结果的质量,就和圣斗士一样,是分等级的。当然因为逼格比较高,所以最高是白金级的,青铜什么的就不能算了。(目前一千美元能测的,应该算钢铁圣斗士。。。)

GRCh38,也就是目前科研上使用的最新版本的人参考基因组,上图看上去数据很完美,但在指导医疗实践上是有问题的,因为它是来源于混合样本,并不能反映任何一个人的单倍型基因组。比如,MAPT(微管相关 Π蛋白)区域,与神经退行性疾病(e.g.帕金森)高度相关的区域,在这种关键区域上,混合样本测得的DNA序列没什么意义。

所以,现在老外搞了个“精准参考基因组”计划(中文名我瞎起的,英文名叫
Reference Genomes Improvement Project)。选取有代表性的人种:

计划采用的路线是用PacBio数据de novo组装,配合BioNano Irys光学图谱来搭脚手架。最后用细菌人工染色体+PacBio来补洞。

这里稍微解释下,为何测高质量的个人基因组需要de novo,而不是resequencing:因为每个人各自都携带有自身独特的、正常的结构变异,使用resequencing也就是比对现成的参考基因组,那么这部分信息毫无疑问会丢失掉。这也是结构变异相关研究比较难做的地方,比如研究癌症,那么最好的对照不是其他正常人,而是自身的正常组织,比如癌与癌旁。

参考资料:
The evolution of animal genomes
Project - The Elizabeth H. and James S. McDonnell III Genome Institute at Washington University

-------------------------------------------------更新---------------------------------------------------------------

Q: de novo 是不是更贵?
价格由选用的技术与所需数据量决定。当然de novo对数据质量、数量、读长、算力都要求更高。

可以把测序拼基因组当成是拼图游戏,有参考基因组,就是拼图的时候,你已经知道最后要拼成的图是啥样子了,也就是可以大致确定手上的碎片是在哪个位置。而无参考基因组,就是拼的时候,并不知道最后结果是什么样子。

拼图游戏的难点在于,图形是否有很多碎片都是同一个样子的(一个基因组是否有许多短重复序列),如果这些碎片完全相同(测序仪读长小于重复序列长度时),你是无法将这些碎片唯一定位到最后的拼图里的。

我认为这里所说测序应该分成几部分:研究性测序;应用性测序
研究性测序:比如某个物种的基因组图谱,针对某个疾病的群体研究等
应用性测序:比如测个人基因组对疾病进行预测

为什么一直测,应该有下面几个原因:
1. 首先是遗传信息的决定作用。所有表型都是遗传和环境的共同作用,但遗传是根本,环境是起影响作用;遗传信息里,作为大多数物种遗传物质的DNA当然应该首要关注。所以要测基因组。地球上如此多的物种,目前尚有大量物种未被测序,所以还一直在测啊测(当然,研究目的就有譬如:开发物种本身经济价值,进化研究等)
2. 同一物种的个体,是有异质性,也就是有个体差异的,正因为这种差异,才会有进化,对有经济价值的物种也才有育种的可能。所以,这就要对同一物种不同个体(即群体)进行测序,这也就是为什么测了5个人后,还测百人,测千人,现在还要测百万人
3. 健康诊断,目前已经有分子诊断、基因诊断,而基因组诊断则是更全面,更本质的诊断(当然目前还有一系列问题没有解决),所以将来会出现人人基因组的局面,那时会是:每个人都在测啊测。

当然,还有一些技术上的原因,开始以为测10个基因组就可以解决问题了,但现在发现测100个都还不够,所以就测了一个又一个。

作者:张旭东
链接:https://www.zhihu.com/question/19929018/answer/522772684
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

对不同群体、不同个体、不同细胞,进行DNA测序、RNA 测序,那自然是没完没了的

但是参考基因组测序为啥没完没了,可以讨论一下

@Tang Boyun 给了已发表的动物参考基因组列表,我刚在专栏《生信笔记》里整理了 2000年至今发表的所有植物参考基因组,一共 335个

张旭东:2000 - 2018,335个已发表植物基因组汇总​zhuanlan.zhihu.com

从 10年的 5 个到 17年69个,今年已经发表了 68 个,还会增加

12年左右,测序物种迅速增多,主要是二代测序成熟的结果。但是现在想想,这么多物种被测序,尤其是很多不那么重要的物种,每个至少 200万起步,很多人质疑是不值得的。得到的不是染色体水平的序列,只是几百甚至几千条 scaffold。不客气的说,很多基因组都是垃圾,没啥用。

到了15年,这种水平的文章已经很难发表了,所以你看到只有 24 个。也许这背后还有很多没发表出来,或者决定补测三代数据。

到了16年,PacBio 开始大量应用到动植物基因组组装(之前价格贵,主要要用在小基因组);17年、18年NanoPore 技术成熟;再加上光学图谱、Hi-C 。可以说所有所有物种都能被组装到染色体水平了。

这个时候,再回头看看当年拼接出来的“垃圾”,简直不能忍,所以第一波测过的物种又被拉出来重新测序,注意是完全重做,不是修修补补。这就是你看到的这两年的第二波高潮。

你比如苹果的基因组,一共三个版本

  • 版本一:2010, nature genetics, Velasco et al.
  • 版本二:2016, Gigascience, Li et al.
  • 版本三:05 June 2017, Nature genetics, GDDH

你比较一下前两个版本和 2017年版本的N50,就知道之前的是不是垃圾,就知道为啥都第三次了,还能发到 NG 。

以上是数据,我们预测一下未来

  1. 未来的两三年,这个高潮还将持续,所有重要物种的参考基因组都会被测序或者重新测序,而且都能发高水平的文章。
  2. 这波高潮过了就过了,短期内没有下一波。因为这波的基因组都装到了染色体水平,修修补补就可以了,没有必要推倒重来。就像人的基因组,只是修修补补。

越来越便宜的测序导致测序数据越来越多,感觉方法学的东西越来越吃香了

因为有这么多的生物,每个生物体的基因组都不一样。再加上表观遗传学之类的东西,相同的DNA,最终的结果也不一样,于是就测啊,测啊~~~

1、不同物种要进行新的测序,现在已测序的物种相当来说还不算多吧
2、对同一个物种重测序,我想你要问的是这个吧。因为即使同一个物种,比如人,个体间还是有差异的,不然为什么人和人之间不一样呢?这些差异在genome上的表现有SNPs、indel(插入缺失)、SV(结构变异)、CNV(拷贝数变异)。这些差异有些导致的是正常的人之间的差异,比如不同的肤色不同的体格,有些则导致的是基因疾病,具体例子我就不多说了,这个网上一搜一大把。如果不进行重测序,你怎么能检测到这些差异呢

话说回来,物种的单个体测序只是为了得到该物种genome的一个reference,真正有实际意义有研究价值的是后面的重测序,因为有对比有差异才能更好的知道基因的作用

除了最简单的DNA层面的测序,还有其他层面的(比如RNA,比如 DNA 甲基化)的测序。而这些测序的 结果是根据时间和空间的不同而随时发生变化的。在不同条件(包括时间和空间上)对他们进行测序,能 够让我们更好的了解到作用机制。 另外,在单个基因组的层面上,除了整个基因组的测序,还有选择性的测序,比如前面提到的SNP, 都可 以算是选择性的测序。所以你也可以看到同一个人测不同次数的情况。 在非单个基因组的层面上,值得一提的有Metagenome(宏基因组),是直接把环境里拿来的sample拿 来测序和还原。站在基因组的角度上来看生物多样性。这也是非常有趣的。 总之,测序是了解生命信息的一种非常好的工具。既然工具好,那么见得多也就不奇怪了。

对于高等生物,比如人类,一些个体高度差异的基因片段有重大的科研与医疗价值。比如MHC、TCR/BCR等等。

对于微生物,基因组发生变化就像吃饭喝水一样寻常。这些变化经常与致病力的变化相关,比如:

  • 为啥有些禽流感病毒能感染人?
  • 为啥有些流感病毒死亡率个位数,有些死亡率两位数?
  • 为啥中了一些大肠杆菌之后拉血,中了另一些水泻,中了另一些脑炎?

另外,很多现有的基因组,其参考序列的质量是非常可疑的,特别是复杂程度高的区域,比如TCR座位。如果你需要研究这些,那么几乎只能亲自重新撸一遍。

所以,骚年,来一发三代吧。。。

原因好多啊。
先说说技术上的。

测序技术目前大概有三代,速度一代比一代快,精度也是越来越高,但是都不能一次测很长的片段,大概 测个500bp(碱基对)就不行了。所以在大规模测序的时候,要把大片段分成小片段测。一个大家比较熟 悉的方法是鸟枪法,就是随机给它打断,测好很多很多小片段以后,再根据小片段两段和其他片段有重复 的部分把小片段拼接起来。

大概这个样子 这么搞会有如下几个问题:

1、 不是所有的小片段都能被测到的,这就导致一个基因组里不是所有的碱基都能被测到。关于这个有一 个公式:

我随便找的一个结构比较清晰的图。 染色体中间有个着丝粒(centromere),两端有两段结构叫端粒,大家注意看着丝粒附近和端粒部分是橙 色的,这块我们叫异染色质(heterochromatin),它就是我刚才说的重复序列很多的部分。所以你别看 人类基因组计划说已经完成草图了,这两块地方基本没测。

当然这些重复序列里面不会藏着太多基因,所以大家也不是那么迫切想去测它。

3、测序是有准确度的,测每一个碱基都有可能出错,这个概率在人类基因组计划时代还挺高的,大概1% 吧,第二代测序在2010年的错误率大概是0.001%,现在的第三代更好一些了,但是还是会出错的。 要知道一个几千bp的基因,产生一个点突变可能就会导致致死遗传病,你一下给测错1%还得了?但是这个 问题也没有什么太好的解决办法,只能重复测很多次,重复测两次某一个位点都被测错的概率就是(1%) ^2=0.001%(这是理想情况,实际上有一些位点更容易被测错)

非技术上的原因就更多了。 人类基因组计划时代,科学家还根本没想到除了碱基序列,其上的修饰也会对基因功能有至关重要的作 用。所以当然当年在测人类基因组的时候,表观遗传学修饰这些东西就没有测。 后来发现这东西太重要了,甲基化的胞嘧啶一度被称为第五种碱基,不测不行,只好重新测咯。 那过几年再发现乙酰化,再来一轮。 如果再过几年再发现个什么十六烷化,还得再来。

更要命的是,这些修饰全都是动态的,在细胞周期的不同时期不同位点的甲基化程度可能变得很厉害。这 就要用到更先进的手段了。 归根结底我觉得还是当年的科学家太乐观,以为知道了碱基序列就知道了一切,没想到拿到碱基序列后怎 么分析一头雾水(所以有了生物信息学),又不断发现别的地方还有遗传信息,于是只好不断修修补补, 就显得没完没了的。 话说回来,这不是好事嘛,如果没有这些新发现,多少生物狗又要转行了。

你说的应该是重测序吧,虽然已经得到好多物种的参考基因组了,但是生物个体间差异的存在是由于每个基因组都是不同的,再者对于基因组本身、基因组和蛋白质、基因组影响性状等方面的机制还不是很清晰,需要大量的数据进行研究,总结规律,进行论证。

按照我个人的理解,对于某个物种来说,只进行一次测序,并不能准确反应这个物种的基因组结构,理由很简单:就算不考虑误差,个体之间也有差异,而且某些种群也处在不断进化的过程中,其基因频率会改变。所以需要不断重测序,使数据更加准确。

A以重头组装说

  1. 同一种内的同一个个体,由于技术的进步,测序组装质量会一天比一天好。但是至今没有哪个个物种能够拿到整条染色体的,尤其是着丝粒附近的区域。所以依据研究目的不同,需要的组装质量不同。
  2. 同一种内,不同个体的基因组差异很大,很难去选几个个体去代表一个种,所以要不断的扩大个体数,拿到高质量的个体组装,来探究种内基因组&遗传多样性与表型多样性的关联,探究种内基因组演化的规律。
  3. 不同种间,基因组大小,复杂程度差异很高,目前技术我们还是解决不了裸子植物的基因组测序组装。根本无法组装到染色体水平,以云杉为例,目前技术我们只能拿到N50 100kb而基因组有22G。

B以重测序说

1.很多研究性或者应用型的测序是有特异性的,比如UK做了biobank 不代表我们中国不用做了。

一个人做了基因筛查,并不代表他的邻居不用做了

2.测序只是一个工具,不同的人要用这个工具去做不同的事情,一些分子生物学与测序的衍生技术例如 Chip-seq, ATAC-seq 极大的丰富了基础科研工作者的工具箱,

综上我们会没完没了的测序下去的。

作者:山石
链接:https://www.zhihu.com/question/19929018/answer/1092853711
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

伴随着人类基因组计划的完成,人类基因组测序工作已经完毕。然而拿到的人类基因图谱并不知道其具体的遗传学效应,所以现在已经进入了后基因组时代,主要是探索基因功能从而加以影响、改造。简单理解就是虽然已经拿到了一堆序列,但是并不知道具体代表什么意义,所以开始了现在的二代测序,探究各个基因的功能。以上仅为个人拙见…

因为每个人的基因组序列都不一样。这些不同造成了每个人的外貌,性格,体质,和疾病的易感性等等生物学特征都不同。了解这些不同对每个人都有意义。而这个世界上,还没有几个人知道自己全部的基因组序列。

来个打油的吧。

地球物种千千万,生命个个自成型。
群体组织和细胞,时时处处变不定。
农林牧渔需求广,个性医疗显威风。
博大世界趣事多,测序永远不会停。

基因组测序为什么没完没了?相关推荐

  1. 【3月30日直播】新冠病毒全基因组测序——Midnight试剂盒及整体解决方案

    识别上方二维码 或点击「阅读原文」 免费报名参加 新冠疫情肆虐全球,基于Nanopore测序技术和数据分析在全球感染性疾病防控中的优势充分显现出来.该平台使用灵活.操作简便.产出快速.分析实时等特征为 ...

  2. ISME | 通过长读长宏基因组测序揭示南极土壤未培养细菌的生物合成潜力

    关注我们 一起探索微生物领域的奥妙 摘要 日趋严重的抗生素抗性问题使得研究者们将目光转移到可能是新的抗生素来源的未培养细菌上.扩增子测序与短读测序分析表明宏基因组中存在多样化的生物合成基因簇(BGC) ...

  3. NBT:主流高通量测序仪在人/细菌/宏基因组测序评测结果发布,华大智造表现优异...

    导读 高通量DNA测序技术(DNA-seq)是临床和基础生物医学研究的重要手段之一.作为一种常规的技术方法,DNA-seq在多个领域均有广泛应用,例如个体基因分型和变异鉴定,种群和物种水平的基因组特征 ...

  4. NAR:中科院微生物所发布全球模式微生物基因组测序计划进展

    10月29日,<核酸研究(Nucleic AcidsResearch)>在线发表了国家微生物科学数据中心(中国科学院微生物研究所微生物资源与大数据中心.世界微生物数据中心)团队关于全球模式 ...

  5. EID:宏基因组测序在新发腹泻病毒鉴定中的应用

    宏基因组测序在新发腹泻病毒鉴定中的应用 撰文:李杰 常熟理工学院生物与食品工程学院 责编:刘永鑫 中科院遗传发育所 写在前面 发现和鉴定新病毒以及确定新病毒与疾病的关系是预防.诊断和治疗新发病毒性传染 ...

  6. 高分文章精选 | 纳米孔宏基因组测序的表现

    在宏基因组测序中,纳米孔长读长可从复杂多样的宏基因组学样本中组装完整的闭环细菌基因组和质粒,提供无偏倚.免PCR扩增的基因组序列.已有越来越多的科学家使用纳米孔长读长来区分近缘物种,解析具有挑战性的重 ...

  7. NBT封面:纳米孔基因组测序快速临床诊断细菌性下呼吸道感染

    文章目录 Nanopore宏基因组测序快速临床诊断细菌性下呼吸道感染 热心肠日报 主要结果 新方法的开发 表1:常规医学培养结果和使用本流程宏基因组输出结果比对 宏基因组流程优化 图1 宏基因组流程示 ...

  8. 一作解读:EID-2017-宏基因组测序在新发腹泻病毒鉴定中的应用

    文章目录 宏基因组测序在新发腹泻病毒鉴定中的应用 写在前面 背景 研究方法 病料收集与反饲 文库构建 基因组组装 基因组注释 研究结果 Reference 作者简介 猜你喜欢 写在后面 宏基因组测序在 ...

  9. 学习全基因组测序数据分析2:FASTA和FASTQ

    本文转载自微信公众号解螺旋的矿工,作者为黄树嘉,已获得授权.黄树嘉写了WGS系列的文章,堪称教科书级别的生物信息学习材料.虽然本平台只关注宏基因组领域,但此系列文章知识体系完善.干货满满,是值得每位专 ...

最新文章

  1. sql server的BCP导入导出(转)
  2. memcache---mongodb---redis比较
  3. idea目录后面有中括号
  4. 重磅!!面试季--最新面试题总结出厂,附题解,后期持续分享!
  5. 神经网络中的常用激活函数总结
  6. visual studio 2019、2017、2015下载网址
  7. C# Color颜色对照表
  8. P1368-工艺【最小表示法】
  9. Samba远程代码执行漏洞(CVE-2017-7494)复现
  10. matlab中结束脚本运行_MATLAB脱单指南
  11. 2013年上半年项目总结
  12. 20160801java学习重点:函数
  13. 【TSP】基于matlab遗传算法求解中国35省会城市旅行商问题【含Matlab源码 1222期】
  14. 在linux上压缩文件,Linux上压缩文件的 5 种方法
  15. excel两个表格数据对比_用vlookup把两个或者多个excel表格,整合到一个表格中
  16. 中国石油行业并购重组趋势与投资战略规划建议报告2022~2028年
  17. 计算机专业的英文简历范文带翻译,[网络工程师个人英文简历模板]英文简历范文带翻译...
  18. 使用dd命令测试CPU性能--用Enki学Linux系列(16)
  19. 三星笔记本bios设置里找不到U盘启动盘的解决方法
  20. LVS NAT模式搭建

热门文章

  1. 简智音科技:抖音与快手相比,谁的前景更好?
  2. 根据输入的电话号码查询联系人
  3. 卸载windows10强推的新版edge浏览器
  4. 深入java集合-HashMap
  5. 瑞萨78K0单片的调试与使用(Minicube2)
  6. Profinet协议基础知识(三)
  7. Excel方向键无法移动单元格/scrollLock解锁方法
  8. 技术分享,休闲娱乐一体的网站
  9. 查看Oracle数据库资源状况
  10. T检验 ANOVA