来源:生物通

加州大学圣克鲁斯基因组研究所(UC Santa Cruz Genomics Institute)的研究人员推出了一种名为“长颈鹿”(Giraffe)的新工具,可以有效地将新的基因组序列绘制到代表多种不同人类基因组序列的“泛基因组”(pangenome)上。

使用泛基因组学方法而不是单一的参考基因组,可以更全面地描述遗传变异,并可以改进广泛的研究人员和临床医生使用的基因组分析(Elena Zhukova)

自从20多年前人类基因组的第一次测序以来,人类基因组的研究几乎完全依赖于一个参考基因组,并与其他基因组进行比较,以确定遗传变异。科学家们早就认识到,单一的参考基因组不能代表人类的多样性,而且使用它会给这些研究带来普遍的偏见。现在,他们终于有了一个可行的选择。

在12月16日发表在《科学》(Science)杂志上的一篇论文中,加州大学圣克鲁斯基因组研究所(UC Santa Cruz Genomics Institute)的研究人员介绍了一种名为长颈鹿(Giraffe)的新工具,它可以有效地将新的基因组序列绘制到代表多种不同人类基因组序列的“整体基因组”。他们表明,这种方法可以对遗传变异进行更全面的表征,并可以改进广泛使用的研究人员和临床医生的基因组分析。

通讯作者Benedict Paten是加州大学圣克鲁兹分校的生物分子工程学副教授,也是基因组研究所的副主任,他说:“我们已经为此努力了多年,现在我们第一次有了比单一参考基因组更快、更好的实用方法。对生物医学的未来来说,基因组学平等地帮助每个人是很重要的,所以我们需要考虑到人类群体多样性而不带有偏见的工具。”

所有人类都有相同的基因,但在基因的确切序列上有许多变化——这意味着DNA亚基(缩写为A, C, T, G)的序列,以及在蛋白质编码基因之外的基因组的大部分区域。单个编码字母的差异被称为单核苷酸变异(SNV),短序列的插入或删除被统称为“indels”。

最复杂的变体是结构上的变体,包括重新安排大段代码(50个或更多字母)。使用单一的参考基因组很难找到这些基因,但它们可以产生显著影响,并且已知在某些疾病中发挥重要作用。每个人都有数百万个SNVs和indels,还有成千上万个更大的结构变体,这些结构变体总体上比其他类型的变体包含更多的代码字母。

Paten说:“基因组学的主力一直是SNVs和indels,因为结构变异一直隐藏在视野之外。泛基因组学让结构变异变得可见,所以我们可以像研究SNVs和短indels一样研究它们。有很多结构变异,它们可以产生很大的影响,所以这对疾病的遗传研究的未来至关重要。”

可以从多个基因组序列中创建泛基因组参考,使用数学图结构来表示不同序列之间的关系。在这篇新论文中,研究人员利用公开数据绘制了两张人类基因组参考图。这些数据被用于评估新工具Giraffe,这是一组将新的序列数据映射到泛基因组参考的算法。

第一作者Jouni Sirén是基因组学研究所的研究科学家,开创了Giraffe的许多关键算法创新。Giraffe可以准确地将新的序列数据映射到嵌入在泛体基因组参考中的数千个基因组,就像现有工具映射到单个参考基因组一样快。该研究还表明,使用Giraffe减少了绘制偏差,即不正确地绘制与参考基因组不同的序列的倾向。

“这种分析方法不仅更好,而且和目前使用线性参考基因组的方法一样快,”基因组研究所的博士后研究员、共同第一作者Jean Monlong说。

廉价的短读测序是现代基因组学的支柱,产生的序列片段必须被绘制到参考基因组上才能理解。测绘显示每个片段属于23条人类染色体中的一条,并识别出个体基因组中每个位置的变异,这个过程被称为基因分型。

研究人员发现,谷歌健康公司的深度学习变异调用者DeepVariant,使用Giraffe对泛基因组的比对比使用对单个参考基因组的比对可以更准确地识别SNVs和indels。

Monlong说他最兴奋的是使用泛基因组学来研究结构变异。

他说:“最近通过长读测序发现了许多结构变异。有了泛基因组,我们可以在短读测序的大型数据集中寻找这些结构变异。这很令人兴奋,因为这将使我们能够在许多人身上研究这些新的结构变异,并就它们的功能影响、与疾病的关联或在进化中的作用提出问题。”

研究人员使用Giraffe绘制了来自5202人的不同群体的序列解读图,并确定了16.7万最近发现的结构变异的基因型。这使他们能够估计这些结构变异的不同版本在整个人类群体中以及在单个亚群体中出现的频率。他们发现,某些变异的频率在不同的亚种群之间存在很大差异,如果只在某些特定变异频率较低的欧洲血统种群中进行分析,可能会被误解。

一个单一的参考基因组必须选择任何变异的一个版本来表示,而留下其他版本不表示。通过使更广泛的具有代表性的泛基因组参考实用,Giraffe可以使基因组学更具包容性。

Paten和加州大学圣克鲁斯基因组研究所的其他人参与了一项由美国国家人类基因组研究所资助的重大努力,以建立一个全面的人类泛体基因组参考,他们预计将于明年发布,作为科学界的资源。

参考文献

Tumour DDR1 Promotes Collagen Fibre Alignment to Instigate Immune Exclusion

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

《Science》基因组比对的革命性技术相关推荐

  1. 一种PacBio测序数据组装得到的基因组序列的纠错方法技术 (专利技术)

    一种PacBio测序数据组装得到的基因组序列的纠错方法技术 技术编号:17008244阅读:83留言:0更新日期:2018-01-11 04:20 本发明专利技术提供一种PacBio测序数据组装后序列 ...

  2. 智能机器人电销软件是革命性技术突破,促进电销效率的飞速提升

    近年来,深度学刁.大数据.并行计算共同推动人工智能技术实现跨越式发展."人工智能"应用已开始落地开花,从智能安防,到智能客服,再到智慧教育和智慧医疗等.基于人工智能技术的各种产品在 ...

  3. 比尔盖茨:ChatGPT开启AI革命性技术的新时代

    来源:AGI产业观察 原文来自于比尔盖茨个人博客 微软公司联合创始人比尔盖茨近日在他的个人博客中畅谈ChatGPT和生成式人工智能对教育.医疗.生产力提升.公平等等方面的影响. 他说,OpenAI发布 ...

  4. [转]音频发展史 革命性技术盘点(上下)

    生活中从来不缺乏声音,有些声音是我们讨厌的,但也有一些是我们喜欢并想留下来的.从留声机诞生的那一刻起,声 音成为一种可以被存储,随时可以被播放的东西,伴随我们的生活直至今天.在这个过程中,我们从记录的 ...

  5. Marine Life Science Technology(海洋生命科学与技术)被SCIE收录

    <海洋生命科学与技术>(英文)被SCIE收录 作者:陈呈超来源:期刊社发布时间:2021-12-07点击数:6430 本站讯 2021年12月4日,由中国科学院院士.中国海洋大学教授宋微波 ...

  6. 宏基因组应用_宏基因组学技术在生物冶金中的应用

    宏基因组学技术与微生物浸出技术 宏基因组学作为新兴的微生物研究方法,其不依赖于有机体的培养技术手段,以微生物多样性.种群结构进化关系.功能活性相互协作关系以及与环境之间的关系为研究目的. 高通量测序技 ...

  7. 王恩东:摩尔定律的终结本质上是没有革命性技术

    编者按:世界互联网大会于11月16日-18日在乌镇举行.CCTV财经频道在大会期间做了特别节目,邀请中国工程院的院士王恩东.中国互动媒体产业联盟专家委员会的委员包冉等嘉宾进行大会点评,讨论今年互联网发 ...

  8. checkm基因组_checkm8漏洞利用的技术分析

    checkm基因组 Most likely you've already heard about the famous exploit checkm8, which uses an unfixable ...

  9. 比尔·盖茨:AI时代已经开启,GPT是40年来最具革命性技术

    Datawhale干货 选自:GatesNotes,来源:机器之能 比尔・盖茨表示:人工智能革命重要程度不亚于手机和互联网的诞生. 周二,微软公司创始人比尔・盖茨在他的博客 GatesNotes 中盛 ...

最新文章

  1. ios超级签名_ios超级签名何以固若金汤?原因在这里
  2. 链接产业 聚变未来 | 移动云区块链开发者论坛来了
  3. 中科视拓开源SeetaFace2
  4. 17.抢购(秒杀)业务的技术要点
  5. Py之tkinter:python最简单的猜字小游戏带你进入python的GUI世界
  6. linux shell 判断文件是否存在
  7. Hibernate4 注解方法说明
  8. Python 一键转 Java?“Google 翻译”你别闹
  9. 在部署服务器端的时候postgresql调试和远程连接操作需要考虑好远程连接问题。
  10. Android 2.3 Gallery3D添加gif支持——修改代码(三)
  11. 编写一个简单加密程序!!!
  12. 计算机配件价格上涨,显卡涨价风声再起 PC配件涨价什么时候是个头
  13. 【云原生】理解k8s中的Pod和容器设计模式
  14. POJ 1877 Flooded! G++
  15. 查询Linux中CPU的核数
  16. 技术人员的公众号如何打造高质量内容和精美排版?
  17. VVC多用途视频编码标准综述与应用1
  18. Asp.net Core + EF Core + Bootstrap搭建的MVC后台通用管理系统模板(跨平台版本)
  19. 特征值是否重根与特征向量及基础解系的关系
  20. java计算机毕业设计物联网实验课程考勤网站源码+lw文档+系统+数据库

热门文章

  1. 学术报告 | 模拟液态和薄结构之间相互作用的多尺度模型
  2. 独家 | 深度学习 V.S. 谜题游戏
  3. 剑指offer:和为S的两个数字
  4. Machine Learning for Encrypted Malware Traffic Classification
  5. 社交网络图挖掘3--重叠社区的发现及Simrank
  6. Python下载文件的11种方式
  7. 兰州大学的《致谢》火了:“我从来不曾优秀过,也从来不曾放弃过!”
  8. 【官方权威教程】 PyTorch 深度学习, 学习PyTorch的必备宝典!
  9. SAP MM 采购发票上的价格与采购订单上价格的差异
  10. SAP RETAIL供应商寄售库存跨公司转移后的库存状况