自己写的笔记

1.WGS和WES

基因检测对明确诊断遗传缺陷病有重要意义,在疾病表型特异度不高,表型基因型对应不明确的情况下,WES-trio是寻找致病基因阳性率最实用的方法之一。WES-trio的阳性率约为30-40%,在一项检测胎儿结构异常的回顾性分析中,234组除外染色体结构异常(chromosomal microarray)的家系进行了WES检测,明确致病突变的家系占10%,另外有20%家系找出了生物信息学分析可能影响功能但是致病证据不充分的突变[1]。目前的许多研究没有详细区分可能影响功能的致病变异和明确导致发病的致病变异,一起笼统的算为阳性检出。

为了进一步提高基因检测的阳性率,随着二代测序成本下降WGS也开始被应用于临床,目前的WGS技术也包含一部分三代测序技术,包括长读长测序和从头到尾测序,三代测序比二代测序在显示染色体结构变异上更有优势但单核苷酸检测的准确性远不如二代测序。现在专家共识认可在临床上应用的WGS是~40X的二代测序技术,和WES比有更高的捕获率和非编码区覆盖度。虽然WGS在提高阳性率上被寄予厚望,但是WGS比WES提高的阳性率并不明显。

对108例WES阴性的样本进行WES的数据重分析以及WGS相对比,WGS只提高了7%(7例)的阳性率,其中4例的变异在WES中也被检测到,但是在分析过程中因为某种原因被过滤,只有3例是仅通过WGS检测到的,这3个变异均位于外显子区[2]。在另一个存在潜在基因缺陷的儿童队列中(n=103),WGS的阳性率是41%。其中70个病人同时进行了WES和WGS, 在这部分病人中有26个病人WES发现了致病变异(37.1%),35个病人WGS发现致病变异(50%),这35个病人包含WES阳性的26个病人。WGS多发现的9个变异分别是2个深度内含子区SNV,2个小CNV,1个非编码RNA,2个线粒体DNA和2个WES覆盖度低的外显子SNV[3]。这两项研究的结果表明WGS比WES致病变异检出率高的优势主要在于捕获率高容易发现CNV和WES捕获率低的区域变异,非编码区测序带来的优势不明显。这可能是由于内含子区变异的注释难度高,难以分析其致病性,在WES和WGS的数据分析中非编码区SNVs的均被过滤到致病变异的候选表格之外。实际上GWAS通过连锁不平衡发现的疾病相关变异有88%在非编码区,45%在内含子区,43%在基因间的非编码区[4]。所以总结一下非编码区SNVs致病性。

2.内含子SNVs影响mRNA可变剪接

实际上内含子和外显子的SNV都有可能影响可变剪切,在mRNA的水平影响功能。RNA-seq是验证变异影响mRNA前体剪接的直接方法,但是涉及额外的成本和组织采集,这里讨论DNA序列。

Gelfman等设计了一个Transcript-inferred Pathogenicity (TraP)评分评价iSNV和同义突变对转录本的影响。评分结果是0-1,<0.459认为是良性变异,0.459≤TraPscore< 0.93为中等致病范围,≥0.93极有可能影响最终转录本[5]。TraP评分是一个在线工具,网址:http://trap-score.org/  搜索输入格式为ENSG编号、基因名称、区域或者变异位点,输出除了TraP评分还有相关疾病,clivar和uniprot链接之类。TraP评分良性和致病位点区分度很高,99%的良性位点得分在0.18以下,所有良性位点得分在0.37以下;所有致病位点的评分均在0.459以上,平均得分0.8;作者说明对已经明确是良性/致病的位点准确度非常高。

SpliceAI(python)可以预测某一个位点在mRNA前体中是剪接供体,受体或两者皆非。SpliceAI是一个包含32层的神经网络模型,分析内容包括侧翼的10000个碱基,可以应对剪接供体受体距离很大的情况。预测对接近外显子的位置预测准确度高,深度内含子区准确率低。可变剪接有组织特异性,强隐形剪接变异可以无视表观遗传学背景强行改变剪接位点,弱变异只能让剪接更接近既定的边界。所以score >0.8的变异更可能无视组织特异性,score 0.35–0.8的低度和中度位点可能受组织特异性影响[6]。SpliceAI可以用pip或者conda安装,GitHub:https://github.com/Illumina/SpliceAI  输入文件是变异列表的VCF,只能是单核苷酸变异或者一个碱基的indel。另外也能输入核苷酸序列。

还有别的很多预测方法但是TraP评分网页版用起来方便,发到nature communication上,SpliceAI发到cell...

3.分支位点(branch point,BP)影响剪切

BP是内含子3’端上游的短motif,当强BP变成弱BP或者弱BP变成强BP时就会影响下游外显子的长度,并且有可能造成移码突变。Leman等评价了几个BP预测软件的准确度,Branchpointer在寻找3‘ss上游的保守和变异BP上准确率最高,分别是99.48%和65.84%。对于出现在BP区的变异对mRNA剪切的影响预测准确度最高的是BPP(89.17%)[7]。

BPP(Python脚本)是基于序列的算法[8],只能输入序列,下载用法见https://github.com/zhqingit/BPP 最强的BP是TACTAAC,BP一般出现在内含子3’ss上游21-100bp。得分没有明确分界值,序列中最高点被认为是BP。

Branchpointer (Bioconductor) 输入变异位置列表或者SNP,输出BP评分,作者推荐cutoff值是0.52。R语言方便作图。下载用法见https://www.bioconductor.org/packages/release/bioc/html/branchpointer.html

应用例子:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6597203/

两个在线BP预测工具:HSF http://www.umd.be/HSF3/

SVM-BPfinder  http://regulatorygenomics.upf.edu/Software/SVM_BP/ 。

4. 启动子和增强子

主要靠GWAS...摘抄点新献的文献

1)Loss-of-function tolerance of enhancers in the human genome[9]

  • 人类基因组至少有28种耐受LOF的增强子
  • 耐受LOF的增强子有组织特异性,作用于可有可无的基因,富集于免疫系统
  • LOF耐受度低的增强子富集于肾和脑/神经干细胞
  • LOF耐受度低的增强子有更多transcription factor binding motif
  • 非保守增强子也可能对LOF耐受度低
  • 文章中包含一个增强子LOF耐受度评分表,一个有监督的随机森林预测

2)Comprehensive In Vivo Interrogation Reveals Phenotypic Impact of Human Enhancer Variants[10]

  • 使用小鼠体内实验验证约1000例增强子区变异致病性,结果显示71%的稀有变异影响表型造成多指畸形,约30%的增强子仍然有活性

1.     Petrovski S, Aggarwal V, Giordano JL, Stosic M, Wou K, Bier L, et al. Whole-exome sequencing in the evaluation of fetal structural anomalies: a prospective cohort study. Lancet. 2019;393(10173):758-67. Epub 2019/02/05. doi: 10.1016/S0140-6736(18)32042-7. PubMed PMID: 30712878.

2.     Alfares A, Aloraini T, Subaie LA, Alissa A, Qudsi AA, Alahmad A, et al. Whole-genome sequencing offers additional but limited clinical utility compared with reanalysis of whole-exome sequencing. Genet Med. 2018;20(11):1328-33. Epub 2018/03/23. doi: 10.1038/gim.2018.41. PubMed PMID: 29565419.

3.     Lionel AC, Costain G, Monfared N, Walker S, Reuter MS, Hosseini SM, et al. Improved diagnostic yield compared with targeted gene sequencing panels suggests a role for whole-genome sequencing as a first-tier genetic test. Genet Med. 2018;20(4):435-43. Epub 2017/08/05. doi: 10.1038/gim.2017.119. PubMed PMID: 28771251; PubMed Central PMCID: PMCPMC5895460.

4.     Hindorff LA, Sethupathy P, Junkins HA, Ramos EM, Mehta JP, Collins FS, et al. Potential etiologic and functional implications of genome-wide association loci for human diseases and traits. Proc Natl Acad Sci U S A. 2009;106(23):9362-7. Epub 2009/05/29. doi: 10.1073/pnas.0903103106. PubMed PMID: 19474294; PubMed Central PMCID: PMCPMC2687147.

5.     Gelfman S, Wang Q, McSweeney KM, Ren Z, La Carpia F, Halvorsen M, et al. Annotating pathogenic non-coding variants in genic regions. Nat Commun. 2017;8(1):236. Epub 2017/08/11. doi: 10.1038/s41467-017-00141-2. PubMed PMID: 28794409; PubMed Central PMCID: PMCPMC5550444.

6.     Jaganathan K, Kyriazopoulou Panagiotopoulou S, McRae JF, Darbandi SF, Knowles D, Li YI, et al. Predicting Splicing from Primary Sequence with Deep Learning. Cell. 2019;176(3):535-48 e24. Epub 2019/01/22. doi: 10.1016/j.cell.2018.12.015. PubMed PMID: 30661751.

7.     Leman R, Tubeuf H, Raad S, Tournier I, Derambure C, Lanos R, et al. Assessment of branch point prediction tools to predict physiological branch points and their alteration by variants. BMC Genomics. 2020;21(1):86. Epub 2020/01/30. doi: 10.1186/s12864-020-6484-5. PubMed PMID: 31992191; PubMed Central PMCID: PMCPMC6988378.

8.     Zhang Q, Fan X, Wang Y, Sun MA, Shao J, Guo D. BPP: a sequence-based algorithm for branch point prediction. Bioinformatics. 2017;33(20):3166-72. Epub 2017/06/22. doi: 10.1093/bioinformatics/btx401. PubMed PMID: 28633445.

9.     Xu D, Gokcumen O, Khurana E. Loss-of-function tolerance of enhancers in the human genome. PLoS Genet. 2020;16(4):e1008663. Epub 2020/04/04. doi: 10.1371/journal.pgen.1008663. PubMed PMID: 32243438.

10.   Kvon EZ, Zhu Y, Kelman G, Novak CS, Plajzer-Frick I, Kato M, et al. Comprehensive In Vivo Interrogation Reveals Phenotypic Impact of Human Enhancer Variants. Cell. 2020;180(6):1262-71 e15. Epub 2020/03/15. doi: 10.1016/j.cell.2020.02.031. PubMed PMID: 32169219.

非编码区单核苷酸变异相关推荐

  1. DNA非编码区,外显子,内含子突变区别

    参考DNA非编码区突变,DNA外显子突变,DNA内含子突变的区别,什么是DNA突变,什么是基因突变_hello~bye~的博客-CSDN博客_非编码区突变是基因突变吗 1.DNA和基因的区别: DNA ...

  2. 编码区和非编码区的关系

    所有的基因都会呈现时间和空间的关系! 编码区是细胞DNA的一部分,我们知道,基因分为:编码区,非编码区.编码区是指能够转录信使RNA的部分,它能够合成相应的蛋白质,而非编码区是不能够转录信使RNA的D ...

  3. MIT设计深度学习框架登Nature封面,预测非编码区DNA突变

    来源:ScienceAI 作者:Raleigh McElvery 编辑:小舟.张倩 来自 MIT 和哈佛大学博德研究所等机构的一项研究刚刚登上了 Nature 封面.他们创建了一个数学框架来预测基因组 ...

  4. 中国农业科学院(深圳)农业基因组所Yuwen Liu课题组诚聘副研究员(30-50万)

    基因组所介绍 中国农业科学院(深圳)农业基因组研究所(简称"基因组所"),是中国农业科学院和深圳市共同举办的新型国家级研究所,以生物组学为核心,辐射农业.食品与健康.生态与环境等三 ...

  5. 全程免费 - 挖矿转录组学大数据,中科院胡松年、方向东等开讲

    ▼生物信息学习的正确姿势(第三版) NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细 ...

  6. Nat Genet | 杨俊/岳峰团队合作揭示GATA3的遗传性非编码变异增加儿童急性淋巴细胞白血病风险的新机制...

    越来越多的研究表明,遗传性胚系突变和体细胞基因突变都可能促进白血病的发生发展.体细胞基因畸变,包括突变.重排.插入和缺失等,已经被证明能够通过显著促进白血病前造血细胞的生存和增殖来驱动白血病的发生.然 ...

  7. 第四章 遗传变异的分类

    第四章 遗传变异的分类 主要为基因组测序比对相关知识,部分内容作笔记自查使用.如有错误或遗漏还请海涵,可评论或邮箱联系. 最后修改时间:2020-05-12 15:07:57 星期二 遗传变异的来源 ...

  8. 第4期 变异注解之旅

    第4期 变异注解之旅 GeneDock聚道科技 为生命计算,助看病不难! 已关注 饭饼饼 . Suranyi 等 20 人赞同了该文章 生信小白:肉哥,在第1期的介绍中,你讲了VCF文件,但我们只知道 ...

  9. 《生物信息学:导论与方法》----变异的功能预测----听课笔记(十一)

    第六章  变异的功能预测 6.1 问题概述 Where did your genetic variations come from? inherited from parents de novo mu ...

最新文章

  1. 基于libmad库的MP3解码简析
  2. 《高阶Perl》——导读
  3. 使用docker搭建一个elasticsearch(5.4)的基础环境
  4. jgit 查看当前分支_分支 (branch)
  5. vim tail head 截取文件 导入
  6. XSS 前端防火墙 —— 无懈可击的钩子
  7. bilibili有电脑版吗_你体验过电脑版的《和平精英》吗?不用担心内存,也不用担心卡顿...
  8. 当开启了延迟加载的开关,对象是怎么变成代理对象的?
  9. LRU原理及其实现(C++)
  10. P3200-[HNOI2009]有趣的数列【卡特兰数】
  11. 延迟关机_苹果电脑到底需不需要关机?关机和休眠你选择哪个
  12. TS Type As
  13. git提交报异常,fatal: The remote end hung up unexpectedly
  14. 八大物联网安全关键技术
  15. AndroidStudio升级到3.1+之后,出现Java.util.NoSuchElementException
  16. elaticsear学习常见错误
  17. wamp服务器离线 所有服务正常运行_你在使用开票软件的时候“突然”!发生“离线发票”我给你支几招...
  18. elasticsearch配置告警方案问题记录
  19. Mean Average Precision(MAP):平均精度均值
  20. 学Python划重点 四 (图形界面wxPython 库的使用)

热门文章

  1. 机器学习实战——3.1 决策树的构造
  2. 怎样查看自己的wifi密码?
  3. 容易发错音的英语单词及音标
  4. [code] PTA 胡凡算法笔记 DAY003
  5. CSS 中的 background 背景属性命令大全
  6. 欧科云链链上卫士:做穿越Web3黑暗森林的那盏探照灯
  7. 深度学习目标检测在游戏领域的应用
  8. 网络传输(个人整理 多网站)
  9. java毕业设计成品源码网站基于javaWeb停车场车辆管理系统的设计与实现|车位
  10. iOS 模拟器安装APP,在电脑上运行ios的app