体细胞选择区分癌基因和抑癌基因

  • 摘要
    • 动机
    • 结果
  • 1 介绍
  • 2 材料与方法
  • 3 结果
    • 3.1 癌症基因的不同选择方式
    • 3.2 GUST方法的执行
    • 3.3 应用于TCGA数据
      • 3.3.1 新型驱动基因
      • 3.3.2 组织特异性谱
    • 4 讨论
  • 5 结论

摘要

动机

癌症驱动基因的功能在不同的组织和器官中有很大的差异。区分每种癌症类型的乘客基因、致癌基因(OGs)和抑癌基因(TSGs)对于理解肿瘤生物学和确定临床可操作的靶点至关重要。虽然有许多计算工具可用来预测假定的癌症驱动基因,但用于OGs和tsg的上下文(情景)感知分类的资源是有限的。

结果

我们发现,蛋白质编码突变的体细胞选择方向和大小在乘客基因、OGs和tsg上存在显著差异。基于这些模式,我们开发了一种新的方法(肿瘤中的选择基因GUST),以癌症类型特异性的方式发现OGs和tsg。通过严格的交叉验证,肿瘤中选择的基因显示出很高的准确性(92%)。它在10 172个肿瘤外显体中的应用发现了已知的和新的具有高组织特异性的肿瘤驱动因子。在多种癌症类型共有的13个OGs中,我们发现11个功能域选择性地参与了不同的癌症,这表明了疾病机制的差异。

1 介绍

在肿瘤发展中,致癌基因(OGs)和肿瘤抑制基因(TSGs)可以互补地促进和维持异常细胞生长。 OG通过功能获得变异导致癌症,而TSG通过功能丧失运作。尽管有一些众所周知的OG(例如RAS)和TSG(例如TP53),但很快就清楚了该基因的致癌活性对于所有类型的癌症都不相同。由于癌症通路的组织特异性,驱动基因的活动强烈依赖于其细胞环境。预测基因在不同癌症类型和细胞环境中的功能状态不仅对了解肿瘤生物学至关重要,而且对指导靶向治疗和药物再利用也至关重要。

有趣的是,只有一种计算方法(20 /20+)可用于预测OG和TSG。 20/20+是20/20规则的扩展,其中OG具有> 20%的突变,导致重复位置的错义变化,而TSG具有> 20%的突变,导致失活的变化。但是,复发性错义突变不是OG的确定性特征,因为由于高突变率,这些事件可以聚集在功能中性(中立)位置,并且许多TSG都具有失活错义突变的热点。同时,随机突变过程可能将**蛋白截短突变(即无义突变和移码突变)**引入OG,这些突变通过遗传漂移而增加频率,而对肿瘤适应性和误导性注释没有重大影响。因此,传统的比率测量方法不足以区分这两组基因。

因为肿瘤的发展是一个进化过程,所以携带体细胞突变的细胞在肿瘤内部处于自然选择之下。阳性选择促进有利的基因型,赋予其更高的适应性。阴性选择消除了具有不良影响的基因型。中性进化使无关紧要的基因型在频率上向上或向下漂移。在OG中,可以通过预期被积极选择的错义突变来实现功能获得。相反,截短蛋白的突变(例如无意义的突变和移码突变)通常使OG失活并且不利于肿瘤适应性,导致阴性选择。在TSG中,当蛋白质截断突变和错义突变导致功能丧失时,可以肯定地选择它们。否则,如果它们破坏了基本的生物学功能,它们可能会中性地漂移,甚至处于阴性选择状态。对于对肿瘤适应性没有显着影响的过客基因(PG),我们预计所有突变均处于中性选择下。

在这项研究中,我们测试了错义突变和截短突变的进化动力学差异是否具有足够的信号和能力,以改善对OG和TSG的检测,使其超出比例测量。这种对比对于区分由错义突变失活的TSG与由错义突变激活的OG是必不可少的,这对于常规的比例测量是一项艰巨的任务,因为在两种情况下均存在错义突变的热点。此外,当基因的活性因癌症类型而异时,体细胞选择的方向和大小也会相应地发生变化,从而能够根据驱动基因的背景进行分类。

我们对来自癌症基因组图谱(TCGA)的10172个肿瘤外显子组(癌症基因组图谱研究网络等,2013)的分析显示,OG,TSG和PG的选择性模式存在显着差异。基于这些模式,我们开发了一种计算方法,将其命名为**“肿瘤中的选择基因”(GUST),该方法将肿瘤发展中的基因的体细胞选择,物种进化过程中的分子保守性以及常规比例测量方法相结合**,以对不同组织和器官中的癌症基因进行分类。

2 材料与方法

调控驱动基因的癌症类型特定功能:为了检验我们的假设并训练随机森林模型,我们需要癌症基因的特定癌症类型功能注释。由于这些注释当前不可用,因此我们使用两个具有互补信息的基因列表进行了手动策展。第一个列表由36个OG,48个TSG和21个具有双重OG / TSG作用的基因组成,并在癌症基因共识中注明(CGC,版本87)。这些基因的肿瘤激活或抑制作用已在实验分析中以癌症为特征得到证实,并且可归因于编码取代或插入缺失。第二个列表由分配给特定癌症类型的235个计算预测的驱动基因组成。这些预测是基于对TCGA样本进行多种计算程序的荟萃分析。这两份清单共有70个基因。然后,我们从TCGA项目中检索了这70个基因的体细胞突变。对于要在特定癌症类型中符合OG要求的基因,需要在CGC中将其标注为OG或双角色基因,在匹配癌症类型的荟萃分析中被预测为驱动因素,并显示突变相应TCGA肿瘤样本中的热点。对于要在特定癌症类型中符合TSG要求的基因,需要在CGC中将其注释为TSG或双角色基因,在荟萃分析中被预测为驱动因素,并且具有截短的突变或相应的TCGA肿瘤样本中的错义突变。对于要在特定癌症类型中符合PG要求的基因,需要在荟萃分析中将其预测为PG,并且在相应的TCGA肿瘤样本中不显示突变热点或截断突变过多。不满足这些要求的基因被删除。最终集合由55个OG注释,174个TSG注释和304个PG注释组成,涉及总共50个已知驱动基因和33种癌症类型(补充表S1)。

体细胞选择特征:给定具有在一组肿瘤样品中报告的具有体细胞突变的基因,我们将错义突变的选择系数表示为w,将蛋白截短(无义和移码)突变的选择系数表示为φ。为了说明突变率的差异,我们考虑了7种取代类型(1:A->C或T->G,2:A->G或T->C,3:A->T或T->-A,4:C->A或G->T,5:C->G或G->C,6:在非CpG位置的C->T或G->A,以及7:在CpG位置的C->T或G->A),一种插入类型和一种删除类型。基于格林曼等人提出的统计框架,观察到这些突变的概率是多项式分布的乘积

其中sk,mk,nk,ik和fk分别是第k个速率类别中观察到的同义,错义,无义,框内插入缺失和移码插入缺失突变的数量;Sk,Mk,Nk,Ik和Fk是通过饱和突变计算的相应预期变化数,其中我们一次引入了每个可能的单核苷酸突变。
tk是观察到的突变总数。 log(w)和log(φ)的值通过最大化对数似然估计L来确定,并限制在[5、5]的范围内。 **log(w)和log(φ)的符号和绝对值指示体细胞选择的方向和大小。**值大约为0表示中性体细胞进化。补充方法和补充图S1中提供了参数调整的详细信息。

GUST算法:GUST是一个随机森林模型,可基于10个特征(补充表S2和图S2)预测基因的类别标签(OG,TSG或PG)。除log(w)和log(φ)值外,我们还计算比例度量以检测突变热点,并计算保护度以估算物种间的替代率。具体来说,给定一个基因和一组在肿瘤样品中检测到的体细胞错义突变,我们应用了带有矩形核和五个蛋白质位置带宽的密度估计,以将紧密排列的突变聚集为峰,并将最高峰表示为峰。为了估算基因的进化保守性,我们从UCSC基因组浏览器下载了100种脊椎动物的多个序列比对,并计算了每个蛋白质位置的取代率。所有位置的平均取代率衡量基因水平的保守性。峰上各个位置的平均替代率衡量了突变热点的保留。对于指定注释中的给定基因/癌症类型对,我们从相应的TCGA肿瘤样本中检索了体细胞突变,并计算了10个特征的值。利用这些训练数据,我们构建了一个包含200棵树的随机森林分类器。对于每个基因,该模型分别产生三个概率分数,分别是OG,TSG或PG。它根据最高的概率分数来分配类别标签。对于所有预测,GUST报告随机森林的概率得分,敏感性和特异性。对于OG或TSG预测,GUST还报告错误的发现率。补充材料中提供了数据处理,特征选择和错误发现率计算的详细信息。

3 结果

3.1 癌症基因的不同选择方式

对于我们手动注释中的每个基因/癌症类型对,我们从TCGA项目中检索了匹配肿瘤样本中的体细胞突变,并计算了体细胞选择系数。我们发现OG中的错义突变比TSG中的错义突变更强,因为平均log(w)分别为4.18和1.68(P <10-10,图1A)。相反,截短蛋白的突变在TSG中显示为阳性选择[平均log(φ)=4.08)],而在OGs中显示阴性选择[分别为均值log(φ)=3.25)。观察到的差异的影响大小非常大,并且P值非常显着(P <10-8)。在PG上观察到的选择措施接近于零[错义的平均log(w)=0.60,无义的突变的平均log(φ)=0.28]。因此,TSG,OG和PG显示出显着的进化差异。

图1.选定基因的选择系数分布。 (A)小提琴图,显示了PG,TSG和OG的log(w)和log(φ)值的密度。 (B)胃癌和黑色素瘤中BCOR基因的体细胞突变的位置分布。垂直线表示在给定位置的各种类型的突变的频率。同义,错义和截断突变分别由绿色,蓝色和红色线表示。灰线是密度曲线。 (C)log(w)和log(φ)值的散点图。六边形框的阴影表示观察次数。 (D)在子宫癌肉瘤中FBXW7基因的体细胞突变的位置分布。 (该图的彩色版本可在生物信息学在线获得)

PG的log(φ)值的分布具有两个峰。接近0的最大峰与预期的中性PG选择一致。第二个峰位于–5附近,表明这些PG的功能丧失对肿瘤生长有害。有趣的是,第二个峰值中的许多基因在其他癌症类型中已建立的TSG中,其功能丧失对肿瘤有益。例如,BCOR基因调节胃癌的凋亡,并具有过量的截短突变。但是,该基因在黑色素瘤中没有截断突变(图1B)。这种对比表明,尽管失能的TSG在某些细胞环境中可促进肿瘤生长,但在其他情况下维持其活性对于肿瘤的发育可能至关重要。然后,我们检查了log(w)和log(φ)值的联合分布,发现体细胞选择模式反映了基因的背景活动(图1C)。例如,PIK3CA基因在膀胱癌,乳腺癌和结直肠癌中具有高log(w)值和低log(φ)值,与其众所周知的OG作用一致。黑色素瘤中该基因的log(w)和log(φ)值接近于零,表明缺乏导致中性模式的作用。最近,在一项研究中提出了PIK3CA在黑色素瘤中的客运作用,该研究表明PIK3CA突变的黑色素瘤细胞依赖于协同信号传导来促进细胞增殖,并且在黑色素瘤中缺乏其他激活驱动基因的情况下,PI3K抑制剂不会抑制肿瘤的生长

对于TSG,例如TP53,它们的高log(φ)值占据了分布图中远离OG的空间(图1C)。如前所述,具有错义突变热点的TSG,例如子宫癌肉瘤中的FBXW7基因(图1D),很难通过比例法与OG区分。根据选择指标[log(w)=5.0,log(φ)=3.9],该基因与OG明确分离[log(φ)<<0],与我们的预期一致。


aMacro-AUC值是通过对三个单对其余ROC曲线求平均值而得出的。
ROC点之间使用线性插值。
TPR,真阳性率,敏感性; TNR,真实阴性率,特异性; PPV,阳性预测值,准确度; NPV,负预测值; ACC,准确性; AUC,ROC曲线下的面积。

3.2 GUST方法的执行

我们使用精选基因的10个特征训练了一个随机森林分类器(GUST)。通过10倍基因保留交叉验证,GUST的测试准确性为0.92。相比之下,整个训练数据集中20 /20+的准确度,为0.86。为了计算传统的效果指标,我们通过将一个类别与其他两个类别的组合(即“一对多”预测)进行对比,将三类预测转换为二进制预测。在所有类别中,GUST的表现都优于20/20+。最大的改进是OG和TSG的识别精度,从20/20+的0.78-0.82提高到GUST的0.85-0.92(表1)。接收器工作特性(ROC)曲线再次证明了GUST的出色性能(图2A)。与20 /20+相比,GUST的PG-vs-rest ROC曲线的曲线下面积(AUC)显着更高(0.97对比0.94,DeLang检验P=0.0008),而TSG-ASC的AUC值显着更高相对于剩余ROC曲线(0.97对比0.93,P=0.001)。但是,这两种方法之间的OG-vs-rest ROC曲线的AUC值没有显着差异(0.99对比0.97,P=0.21)。

为了评估GUST分类与其他预测癌症驱动因素但不区分OG和TSG的方法的一致性,我们通过将每个基因的OG和TSG分数相加来计算驱动分数。 TCGA PancanAtlas财团报告了基于12种计算方法的共识预测得出的推定驱动基因的集合。我们首先检查了通过2种方法预测为驱动因素的510个基因/癌症类型对(204个独特基因)。在这个允许的清单中,GUST预测了373对(73.1%,145个独特基因)作为驱动因素。然后,我们检查了通过3种方法预测为驱动因素的283个基因/癌症类型对(109个独特基因)。在这个更加严格的清单中,GUST预测有254对(89.8%,96个独特基因)是驱动因素。这些结果表明,GUST预测的驱动程序与现有方法高度吻合,同时提供了其他OG / TSG分类。

为了衡量随机森林模型中每个预测变量的重要性,我们通过对袋外样本进行置换来计算平均降低的基尼系数最有用的预测因子是截断突变的选择系数和分数,其次是错义突变的选择系数和分数(图2B)。有趣的是,进化保护并不十分有用,这可能是因为众所周知,绝大多数驱动因素都发生在高度保守的位置,而区分OG和TSG的能力有限。

图2. GUST方法。 (A)GUST和20 /20+的相对于其余预测的ROC曲线。(B)随机森林模型中每个要素的可变重要性。 (C)MB21D2基因的体细胞突变的位置分布。从膀胱癌,宫颈癌,头颈癌,肺腺癌和肺鳞状细胞癌的肿瘤样品中组合突变。突变热点位于对应于蛋白质位置311的编码位置931。(D)估计了每种癌症类型中的MB21D2基因(点)和组合样品(交叉)的选择系数。虚线是使用所有TCGA样品分析的所有基因的平均选择系数。阴影区域是均值选择系数的95%置信区间。

尽管患者的复发已被视为功能选择下突变的替代物,但最近的研究表明乘客热点突变是常见的。例如,多种癌症类型的多个样本在MB21D2基因的931位具有C-> T或C-> G突变(图2C,补充图S3)。 Buisson等发现该突变热点是由于其位于易诱变的发夹环中,并起着乘客的作用。 GUST分析证实,该基因的选择模式与单个癌症类型和组合样品中的中性进化一致(图2D)。因此,GUST正确地预测了MB21D2基因为PG。这证明了在癌症基因分类中量化遗传改变对肿瘤适应性的贡献的有效性。

3.3 应用于TCGA数据

我们从跨越33种癌症类型的10 172 TCGA肿瘤样品的全外显子组测序数据中检索了体细胞突变。然后,我们删除了低质量的突变,超突变或低突变的样本,少于四个蛋白质改变突变的基因以及在<2%的肿瘤中突变的基因(补充材料)。我们将GUST应用于其余的9663个样本。我们预测了161种OG,其中98种是29种癌症类型中的独特基因。我们还预测了331个TSG,其中179个是33种癌症类型中的独特基因(图3A,补充表S3和S4)。

3.3.1 新型驱动基因

GUST预测的驱动程序由55个假定的OG和97个假定的TSG组成,在CGC数据库中被归类为PG。这些新的假定驱动因素中的大多数(81.7%)仅在一种癌症类型中进行了注释,概率得分较低。为了估计每个预测的置信度,我们基于ROC曲线计算了每个相对于静息预测的敏感性和特异性。然后,我们得出了由22个OG-vs-rest特异性≥0.99的OG和74个TSG-vs-rest特异性≥0.99的TSG组成的高可信度驱动程序列表,所有这些(列表)均具有PG-vsrest敏感性≥0.99。高可信度驱动程序的简短列表包括CGC中未注释的两个新颖的OG和28个新颖的TSG。两种新型OG(黑色素瘤中的CNOT9和胸腺瘤中的GTF2I)具有单个突变热点,可破坏高度保守的蛋白质位置(图3B和C)。 GTF2I突变体在体外刺激细胞增殖,并与胸腺瘤的良好预后相关。



图3. TCGA样品的GUST分析。 (A)在每种癌症类型中发现的常见和稀有OG和TSG的数量。癌症类型的缩写列在补充表S3中。(B–E)新型OG和TSG中体细胞突变的位置分布。在每个图的上方显示了每个位置的进化保守性,以每十亿年的取代数衡量。 (F)具有不同组织特异性谱的驱动基因的分布。 (G)在肺腺癌和神经胶质瘤(低度神经胶质瘤和胶质母细胞瘤的合并)中EGFR基因突变的位置分布。 (H)驱动基因和癌症类型的双向聚类。使用了在一种以上癌症类型中发现的驱动基因(红色表示OG,蓝色表示TSG)。 (该图的彩色版本可从在线生物信息学获得。

所有新的TSG都有大量的截短突变(补充图S4)。例如,在40例结肠癌中观察到SOX9中的移码突变(图3D)。作为一种非典型的肿瘤抑制因子,SOX9已显示与核b-连环蛋白相互作用。 SOX9的失活导致致癌性Wnt / b-catenin信号通路的抑制作用丧失,并与患者存活率相关(Prevostel等,2016)。一些新颖的TSG包含突变热点。例如,BMPR2中的N583fs移码突变引入了蛋白质合成的过早终止,并且在9例胃腺癌中被观察到(图3E)。我们检索了文献,发现了22种(78.6%)新型TSG的抑癌功能的支持证据(补充表S5)。许多其他新颖的TSG也被其他计算方法注释为推定的驱动力。

作为对这些预测驱动基因有效性的独立评估,我们检查了主要克隆中有多少突变,并与PG进行了比较。基本原理是,在亚克隆中频繁突变的基因可能没有暗示选择性优势,而是其他机制,例如增加的背景突变率。具体来说,我们使用SciClone根据变异的等位基因频率对每个肿瘤中的突变进行聚类。我们将等位基因变异频率最高的聚类视为主要克隆,将其余聚类视为亚克隆。对于30个新的驱动基因,93.2%的蛋白质改变突变位于主要克隆中,与96个已知驱动基因的百分比(93.7%)相似(Fisher的精确检验P=0.54)。对于40个最频繁突变的PG,主要克隆中的蛋白质改变突变百分比明显较低(89.9%)(Fisher的精确检验P=10^- 4^)。因此,这些预测的驱动基因极有可能促进肿瘤发生。

3.3.2 组织特异性谱

即使删除了低置信度的预测,由GUST注释的大多数驱动程序也仅参与一种癌症类型,显示出很高的组织特异性。在这一高可信度研究组中,只有13个(59.1%)OG和25个(33.8%)TSG是广谱驱动因子,可促进两种或多种癌症类型的肿瘤发生(图3F)。最普遍的OG是在15种癌症类型中高信度发现的PIK3CA基因,其次是在13种癌症类型中发现的KRAS / NRAS / HRAS基因。 TSG最普遍的是在18种癌症中发现的TP53基因,其次是在10种癌症中发现的ARID1A基因。

此外,在13个广谱OG中,有11个具有多个热点(在Bonferroni校正后,单侧比例检验P <0.05,补充图S5和补充方法)。对于每个重要热点,我们检查了NCBI基因数据库中注释的受影响功能域。代表性的例子是EGFR基因。在肺腺癌中,48%的错义突变聚集在一个影响酪氨酸激酶激活环的突变点上(图3G)。在神经胶质瘤中,只有一个突变击中该环(卡方检验P <10-18),所有错义突变的69.3%聚集在两个热点上,影响了激酶活性以外的细胞外域。在神经胶质瘤中避免激酶催化结构域的突变的背景选择提示了激活EGFR信号传导的替代途径。实际上,一些研究已经报道了这些热点突变与不同水平的EGFR活性之间的关联。对于癌症治疗,尽管阻断EGFR的酪氨酸激酶抑制剂在肺癌的治疗药库中很常见,但即使采用改良的药物递送技术,这些药物也未能成功治疗神经胶质瘤。穿透血脑屏障。这些发现提示了研究和加强当前治疗方案的潜在方向。

有趣的是,这33种癌症类型中的每一种都至少参与了一种广谱驱动因子和多种组织特异性驱动因子,暗示了趋同和趋同的疾病途径的同步性。基于广谱驱动基因的癌症聚类将与它们的组织和细胞起源基本匹配的癌症类型分组(图3H)。

4 讨论

区分各种癌症类型中的OG和TSG对了解癌症病因和确定临床上可操作的靶点至关重要。在这项研究中,我们证明了OG和TSG中的蛋白质编码突变是在不同的体细胞选择下,并随后开发了GUST方法来发现癌症驱动基因的癌症类型特异性功能。我们将GUST与20 /20+方法进行了比较,这是唯一可用于分类OG和TSG的方法。 GUST和20/20+均采用随机森林模型来整合从肿瘤外显子组提取的特征。尽管GUST仅使用10个功能,而20 /20+中仅使用24个功能,但GUST的准确性始终较高。在GUST模型中,选择措施贡献了最多的信息内容。在20/20+中,失活突变富集的P值是最有用的特征。有趣的是,尽管它不是严格的进化手段,但它也与选择有关。这些结果表明,使用在进化机制上设计的少量特征比将大量原始特征提供给机器学习模型更有效。此外,由于缺乏特定癌症类型的已知驱动因素,减少预测模型中的特征数量有助于减轻过度拟合的问题

我们承认,最近已经开发了driverMAPS方法,该方法可在三种竞争模型(即PG,OG和TSG模型)下估算基因的选择系数。但是,此方法随后将OG模型和TSG模型组合为驱动程序模型,并将其与PG模型进行对比以预测驱动程序基因。因此,报告的后验可能性和错误发现率仅用于区分驱动者(程序)和乘客,而不是OG与TSG。通过与driverMAPS的作者进行的个人交流,我们确认该方法不提供OG和TSG分类的统计意义。因此,我们没有将GUST与driverMAPS进行比较。

尽管我们发现了许多已知和新颖的癌症驱动基因,但在我们的分析中,它们都没有高可信度地显示出双重OG / TSG作用。一个简单的解释是,GUST会基于改变蛋白质的替换和插入/缺失进行预测,因此它无法捕获通过其他机制起作用的基因,例如非编码调控变体,拷贝数变体,易位,融合,差异表达,翻译后修饰和表观遗传规则。**进一步的研究将揭示改变双重作用驱动员(程序)路径的关键开关。**我们还注意到,只有极少数突变的基因可能会在选择系数的最大似然估计期间引起非收敛性问题,这限制了GUST在发现稀有驱动因子方面的应用

为了实际使用,我们建立了一个在线数据库(https:// liliu lab.shinyapps.io/gust),其中包含对TCGA样品进行分析的预计算结果。用户可以查询数据库并目视检查所选基因的体细胞选择模式和保守模式。结合显示基因是否已被CGC注释为驱动程序或药物靶标的信息,用户可以就优先考虑候选基因做出明智的决定,以进行进一步研究。 Github上提供了GUST算法的R实现(https://github.com/liliulab/gust)

5 结论

体细胞选择是突变基因对肿瘤适应性影响的定量测量。 GUST方法直接从全外显子组测序靶向测序数据估计这些特征,并精确定位在不同细胞环境中驱动肿瘤发生的基因和功能域。由于以基因为中心的治疗和药物再利用引起了越来越多的兴趣,我们希望这种新方法和在线数据库将有助于发现具有临床作用的靶标。

Somatic selection distinguishes oncogenes and tumor suppressor genes相关推荐

  1. Question: Database Of Tumor Suppressors And/Or Oncogenes

    https://www.biostars.org/p/15890/ 71 5.9 years ago by Malachi Griffith ♦16k Washington University Sc ...

  2. Knowledge based | 如何获取某类肿瘤中所有已被报道的相关突变基因?

    当你的肿瘤高通量测序样本越多,或没有病人自身配对的癌旁与血液等非体细胞突变受累组织的配对时,那么WES或WGS所获得的体细胞突变数量将会非常多,所涉及的基因也很多,以至于突变Maf图无法阅读 (基因太 ...

  3. DNA甲基化与癌症、泛癌早筛 | DNA methylation and pan-cancer

    虽然我们现在完全没有甲基化的数据,但还是可以了解一下. 什么是DNA甲基化,与组蛋白修饰有什么联系? DNA Methylation and Its Basic Function 表观的定义就是DNA ...

  4. 哈佛大学刘小乐教授讲授的计算生物学和生物信息学导论 (2020 视频+资料)

    生物信息学习的正确姿势 NGS系列文章包括NGS基础.高颜值在线绘图和分析.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流 ...

  5. 2022年中科大分子生物学考试题、复习资料汇总(往年真题复习资料)

    文章目录 1.2022复习题 2.2021复习题 3.2020复习题 4.2018复习题 5.2015-2016复习题 6.Key:复习重点 7.随堂测验-平时成绩 分子生物学复习资料及往年考题 1. ...

  6. 原癌基因和抑癌基因总结

    原癌基因:肿瘤是由环境因素和遗传因素相互作用所导致.原癌基因和抑癌基因都是在细胞生长.增殖调控中起重要作用的基因.原癌基因(细胞癌基因)是指存在于生物正常细胞基因组中的癌基因.正常情况下,存在于基因组 ...

  7. 易基因|不同DNA甲基转移酶(DNMT)在癌症发病机制中的作用: 深度综述

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. DNA甲基化是调控基因表达最重要的表观遗传机制之一.DNA甲基转移酶(DNA methyltransferases,DNMT)在基因组D ...

  8. 甲基化特异性区域的计算鉴别

    多形性成胶质细胞瘤(GBM)甲基化区域的计算鉴别 目的:找出胶质细胞瘤特异性甲基化区域,为临床诊断提供理论依据 步骤: 1.  查找数据:下载TCGA中GBM的RNA-seq和甲基化数据 2.  甲基 ...

  9. 实验记录 |6/3 somatic.al配置服务器环境

    6/3(8:40) 之前没有安装Varscan.现在检索安装. 下载Varscan的安装包:https://sourceforge.net/projects/varscan/files/VarScan ...

最新文章

  1. python 之路200行Python代码写了个打飞机游戏
  2. centos7上安装redis6-0-5
  3. 第一次作业+105032014116
  4. 栈的链式存储及常用操作
  5. 图解|查找数组中最大值的5种方法!
  6. python 大众点评模拟登陆_python项目实战:模拟登陆163邮箱,简单到爆
  7. How to check firmware and drivers of a VMware ESXi host
  8. 2021-08-08索引在小数据量的时候用处不大,但在大数据的时候十分明显
  9. 关于win7系统重装完鼠标不能用的解决办法
  10. html在手机显示时间,手机北京时间校准
  11. 自然资源部卫星遥感应用报告(更新至2020)
  12. 设计简单计算机主机系统,【效率】专为Win7系统设计的最小Pomodoro-MiniPomodoro(随附...
  13. 第十一周项目二----用二叉树求解代数表达式
  14. Xsolla对话成都游戏茶馆CEO
  15. 解决表格的Drag a column header here to group by that column
  16. 谷歌地图开发使用记录 Google Maps
  17. word-spacing、word-break、letter-spacing和white-space
  18. 我们已经走得太远,忘记了为什么出发
  19. 获取全国地铁线站口数据(Python+百度API)
  20. 美图秀秀巧调色 打造温润柔和的人像照

热门文章

  1. 计算机主机电源接线,七个步骤教你主机电源如何接线
  2. mysql 部分汉字乱码_一次mysql部分汉字乱码解决过程
  3. Kotlin版本的新闻类APP 简闻
  4. 如何提取Excel中部分内容?
  5. 杨贵妃深受日本人喜爱 供奉为“热田大明神”
  6. H5地理定位、百度地图使用
  7. C#学习——识别U盘
  8. 全球与中国云浏览器隔离市场深度研究分析报告
  9. 江苏发展大会上有哪些科技界大佬,他们的“隐私”你知道多少?
  10. CAD绘图次序快捷键是什么?怎么用?