撰文 | 赵齐/陈衍行

结直肠癌(Colorectal cancer, CRC)是全球发病率排名第三的恶性肿瘤,每年新发病例超过180万,死亡病例超过91万1。深入探索结直肠癌基因组分子特征,是未来转化医学研究、开发新治疗靶点、进而改善结直肠患者预后的关键基础。近些年,以TCGA(The Cancer Genome Atlas)的为代表的多个大规模的基因组、多组学研究队列【2-4】很大程度的探索了结直肠癌的基因组重要特征,为认识肠癌的发病机制提供有力参考。但遗憾的是,这些研究队列或主要由西方人群队列组成、或基于临床的基因Panel检测(有限的基因数目)、或较小的研究样本队列。因此,缺乏更全面系统的、以中国人群为主的结肠癌基因组临床关联分子特征研究以及可以用于临床的分子分型体系。此外,线粒体基因组也是基因组的重要组成部分,而结直肠癌线粒体基因组特点与染色体基因组变异的关系、及其与肠癌患者临床特征的联系也缺乏系统的研究。

2022年4月29日,中山大学肿瘤防治中心徐瑞华教授团队在Nature Communications在线发表了题为Comprehensive profiling of 1015 patients’ exomes reveals genomic-clinical associations in colorectal cancer的论文。该研究对1015例中国结直肠癌的患者的肿瘤组织和配对癌胖组织进行了高深度的全外显子组测序(WESplus),全面解析了结直肠癌的染色体基因组变异事件、免疫原性特征以及线粒体基因组特点,并基于不同维度的基因组分子特征构建了多个不同分子分型。研究还结合队列丰富的临床资料信息,深度探索了结直肠癌分子特点与患者临床特征的关联性、鉴定了多个重要的分子指标。因此,本研究拓展了对我国人群肠癌基因组认知的同时,为肠癌生物标志物探索以及新治疗靶点的开发提供了重要的数据资源。

在人群构成上,本研究队列相比于TCGA的肠癌队列,具有更高比例的左半肠癌、直肠癌、转移性结直肠癌,以及更低的中位患病年龄。团队首先解析了1015例患者的染色体基因组变异事件,发现中国结直肠癌患者的中位肿瘤突变负荷(Tumor Mutation Burden, TMB)为1.74 Muts/Mb (0-339.7),超突变人群(TMB ≥ 10Muts/Mb)占总人群的7.09%。此外,超突变的结直肠癌的拷贝数变异(Copy Number Variation, CNV)负荷显著低于非超突变患者。基于整合了多个不同原理的显著突变基因(Significant Mutated Gene,SMG)检测算法,共鉴定了46个结直肠癌高置信度的SMG (High-Confidential SMG, HC-SMG),包括既往常见的TP53,APC,KRAS,FBXW7等基因以及8个在结直肠癌中新发现的HC-SMG,包括LYST,DAPK1,CR2,KIF16B,NPIPB15,SYTL2,ZNF91,KIAA0586,TALPID3,其突变发生在14.9%的结直肠癌人群中。

图1.肠康队列临床资料概览

利用全外显子鉴定的体细胞突变和拷贝数变异事件,研究团队进一步采用非监督的聚类方法将结直肠癌患者分为四个分子亚型,包括超突变型(Hypermutated,HM),基因组稳定型(Genome Stable),染色质不稳定型-高危(Chromosomal instability-high risk, CIN-HR)以及染色质不稳定型-低危(Chromosomal instability-low risk, CIN-LR)。其中,超突变型具极高的突变负荷,是已知肠癌基因组中存在的重要特征,在四型患者中预后最好;CIN-HR 具有高拷贝数变异负荷、主要携带10q21.21、7q11.1等区段扩增的特点,在四型患者中预后最差,具且有最较高比例的IV期患者;CIN-LR型患者同样具有高拷贝数变异负荷,但与CIN-HR携带的高频CNV事件不同,其主要携带20q扩增,预后介于HM型和CIN-LR型之间;GS具有低突变负荷和低拷贝数变异,预后与CIN-LR型相当(图2)。值得一提的是,研究团队在TCGA的数据中也验证了这一分型。因此,这部分解析了CIN亚型结直肠癌分子特征和临床特点的异质性,鉴定了可区分CIN亚型的分子事件10q21.21扩增,有望成为结直肠癌基因组分子分型的重要补充,为其个性化精准治疗和临床预后判断提供指导。

图2. 结直肠癌的基因组分子分型

进一步地,围绕近年来肿瘤免疫治疗相关的进展,研究团队将目光转向肿瘤基因组异常来源的免疫原性分析。为此,研究团队解析了1015例结直肠癌的新抗原(neoantigen),发现结直肠癌的新抗原主要来源于锌指蛋白家族的突变以及RAS突变,并且可以基于携带新抗原的数量,将结直肠癌患者分为高新抗原负荷组(Tumor neoantigen burden-high, TNB-H)和低新抗原负荷组(Tumor neoantigen burden-low,TNB-L)。此外,肿瘤可以通过多种途径减少自身新抗原的提呈,降低自身的免疫原性,以逃避机体免疫系统的清除,包括HLA的杂合性缺失(LOHHLA),抗原呈递相关基因的突变(neoantigen presenting gene mutation, NPG-Mut)以及免疫编辑(Immunoediting)。根据是否发生免疫原性降低的相关事件,结直肠癌患者可以分为免疫原性降低型(Immunogenicity-reduced, IR)和非免疫原性降低型(Non-immunogenicity-reduced, nIR),结果发现IR型患者在HM亚型的结直肠癌患者频率最高。此外,同时具有低新抗原负荷的IR型结直肠患者,与其他结直肠癌患者相比,具有更差的临床预后。该部分通过大队列数据解析了结直肠癌的免疫原性特点,证明了免疫原性特点对于结直肠癌患者临床预后判断的潜在价值。

既往研究发现,线粒体基因组不稳定广泛存在各个肿瘤中,且与肿瘤发生发展有重要的关系【5】。本研究针对这一主题,围绕WESplus可捕获线粒体基因组全长的特殊性,全面解析了结直肠癌的线粒体基因组异常情况。结果发现,66%的结直肠癌患者携带有线粒体基因的突变,而在所有的线粒体编码基因中,突变频率最高的三个基因为ND5(15%),CYB(13%)以及ND4(11%)。此外,研究基于WES的数据定义了线粒体基因组拷贝分数(mScore),临床资料关联分析发现,mScore与结直肠癌患者的预后高度相关,携带高线粒体拷贝数变异(mScore-High)患者的预后显著差于携带低线粒体拷贝数变异(mScore-Low)的患者。进而我们使用qPCR技术简化了mScore的应用,并验证了mScore对于预测结直肠癌患者预后的意义。该研究还分析了mScore与染色体基因组变异的关系,发现mScore-High的患者具有更高频率的TGF-beta通路变异。此外,mScore还与节律相关染色体基因组突变特征(Clock-Like mutational signature)的比例正相关,与dMMR相关染色体基因组突变特征比例负相关。该结果证实了mScore与染色体基因组变异的关系,为探索染色体基因组变异与线粒体基因组的相互影响提供了数据基础。

综上,本研究建立了超过千例的具有长期随访等临床资料的结肠癌人群全外显子组数据队列。研究团队利用丰富的生物信息学数据挖掘分析方法,对中国人群的结直肠癌进行了全面的基因组分子表型和临床关联研究,利用多个维度的基因组分子特征构建了肠癌临床相关的分子分型,为深入理解结直肠癌的发生发展机制和推进结直肠癌的临床精准诊疗提供了重要的数据及理论支持。

中山大学肿瘤防治中心徐瑞华教授、王峰教授为论文的共同通讯作者,中山大学肿瘤防治中心赵齐副研究员、王峰教授、陈衍行博士以及海普洛斯生物科技有限公司陈实富博士为论文的共同第一作者。

原文链接

https://www.nature.com/articles/s41467-022-30062-8

参考文献

1 Sung, H. et al. Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. CA Cancer J Clin 71, 209-249, doi:10.3322/caac.21660 (2021).

2 Cancer Genome Atlas, N. Comprehensive molecular characterization of human colon and rectal cancer. Nature 487, 330-337, doi:10.1038/nature11252 (2012).

3 Yaeger, R. et al. Clinical Sequencing Defines the Genomic Landscape of Metastatic Colorectal Cancer. Cancer Cell 33, 125-136 e123, doi:10.1016/j.ccell.2017.12.004 (2018).

4 Giannakis, M. et al. Genomic Correlates of Immune-Cell Infiltrates in Colorectal Carcinoma. Cell Rep 15, 857-865, doi:10.1016/j.celrep.2016.03.075 (2016).

5 Yuan, Y. et al. Comprehensive molecular characterization of mitochondrial genomes in human cancers. Nat Genet 52, 342-352, doi:10.1038/s41588-019-0557-x (2020).

往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

徐瑞华/王峰教授团队建立我国千人肠癌基因组新分型相关推荐

  1. 港科百创 | 苏孝宇教授团队获数千万元Pre-A轮融资,祝贺「音科思」!

    近日,音科思(深圳)技术有限公司获得数千万元Pre-A轮融资.本轮融资将主要用于新产品研发.团队扩充.用户体验与营销推广,进一步深耕市场,强化产品优势及规模化落地. 音科思创始人张健钢先生(左)及苏孝 ...

  2. 华中科技大学计算机徐永兵,ACS Nano报道王学锋教授、徐永兵教授、张荣教授团队在拓扑自旋电子器件领域的重要进展。...

    近日,南京大学电子科学与工程学院王学锋教授.徐永兵教授.张荣教授团队在拓扑自旋电子器件领域取得新进展,通过引入非磁元素掺杂而诱导拓扑绝缘体发生拓扑量子相变,测量到了奇异的三轴各向异性磁电阻,并研制出新 ...

  3. 清华AMiner团队推出AI订阅:实时追踪科研动态,定制个人科研信息流 | 专访唐杰教授团队

    科技情报大数据挖掘与服务系统平台 AMiner,是由清华大学计算机系唐杰教授团队建立,具有完全自主知识产权的新一代科技情报分析与挖掘平台. 近日,清华大学 AMiner 团队再次上线重磅功能 --AI ...

  4. 北京师范大学人工智能学院黄华教授团队招聘青年教师和博士后

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 本文转载自:新智元  |  编辑:LQ [导读]青年教师.博士后岗位招新!北京师范大学人工智能学院黄华教授团 ...

  5. 作者:聂瑞华(1963-),男,华南师范大学计算机学院教授。

    聂瑞华(1963-),男,华南师范大学计算机学院教授,中国计算机学会高性能计算专业委员会委员,广东高等教育学会信息网络专业委员会副理事长,华南师范大学"教育部互联网应用创新开放平台示范基地& ...

  6. 河南大学计算机系导师张重生,《大河报》我国首款AI甲骨缀合产品发布,河南大学留学归国人员联谊会会员张重生教授团队主研...

    10月31日,中国古文字研究会第二十三届学术年会在河南大学举行,来自中国社会科学院.北京大学.清华大学.浙江大学.复旦大学.南开大学.中山大学.中华书局.故宫博物院等近二百位专家齐聚开封,共话甲骨文等 ...

  7. 【VCSEL】加州大学伯克利分校常瑞华教授谈VCSEL

    五分钟光学-加州大学伯克利分校常瑞华教授谈VCSEL VCSEL (Vertical Cavity Surface Emitting Laser,垂直腔表面发射激光器),是3D成像模组中的关键器件,具 ...

  8. 浙大神经中心李晓明教授团队在《自然-神经科学》发文发现恐惧情绪的新环路...

    左起:余小丹,沈晨杰,付佳毓,王浩,李晓明,李春悦,郑迪 来源 : 浙江大学神经科学研究所 北京时间4月29日23时,浙江大学医学院李晓明教授课题组在<自然-神经科学>(Nature Ne ...

  9. 港科夜闻|香港科技大学副校长(研究及发展)叶玉如教授团队成功开发出简单有效的血液检测方法...

    关注并星标 每周阅读港科夜闻 建立新视野 开启新思维 1.香港科技大学副校长(研究及发展)叶玉如教授团队成功开发出简单有效的血液检测方法.由国际知名神经生物学家.香港科技大学副校长(研究及发展)叶玉如 ...

最新文章

  1. Myeclipse安装、配置、测试
  2. websphere mq 查看队列中是否有数据_全网最全的 “消息队列”
  3. Java 8 中 Map 骚操作之 merge() 的用法
  4. P2796-Facer的程序【dp】
  5. 如何使用不同的记录器实现配置SLF4J
  6. discuz安装_手动搭建 Discuz! 论坛
  7. 【转载】基于Redis实现分布式锁
  8. 【每天一个 Linux 命令】tree命令
  9. matlab可以仿真液压系统,基于Matlab计算机仿真在液压系统中的应用
  10. 解决: Couldn‘t find meta-data for provider with authority xxx.fileProvider
  11. xmlspy php,XML Spy实例代码详解(图)
  12. 深入浅出、通俗易懂的讲解CAN bus
  13. BIM+3DGIS的行业应用探讨
  14. Sun jdk, Openjdk, Icedtea jdk关系
  15. LeetCode 739. 每日温度(java实现)
  16. 论文:Linguistic Structure Guided Context Modeling for Referring Image Segmentation
  17. 用汇编语言写51单片机程序开头为什么一般都这样:ORG 0000H LJMP MAIN ORG 0030H
  18. 什么是 MATLAB 搜索路径
  19. 曹雪芹诗歌中的鸿蒙,曹雪芹的诗词丢失,红楼梦里的诗句
  20. EK1100和EK1110简介

热门文章

  1. matlab 罗德里格 公式,旋转矩阵,四元素,欧拉角
  2. 罗斯蒙特变送器怎么恢复出厂设置?
  3. POJ 2492 并查集,带权或带偏移量并查集 【例题详解】
  4. 看中国 | 王强:化解供需错配新零售行业必须回归两大职能
  5. 跟着鬼哥学爬虫-3-美女图片!!!
  6. 游记_2021icpc济南
  7. 使用表单完成完成个人信息网页的设计 基本信息:姓名,学号,出生日期,手机号码,证件类型,证件号码,学校,学院,专业,学制,入学时间,个人证件图像
  8. GIS有关软件、框架、代码、资源整理
  9. 算法分析设计 | 4.动态规划
  10. FastDFS--原理篇