AlphaFold蛋白质结构预测协助发现首个CDK20的小分子抑制剂
近年来,AlphaFold的横空出世在结构生物学领域实现了一场变革。这种能准确预测蛋白结构的AI系统,已经应用于生命科学研究的各个场景。去年7月,AlphaFold预测出98.5%的人类蛋白结构;现在,AlphaFold又站上了药物研发的战线。其预测的结构可以促进基于结构的药物设计,特别是对于那些缺乏足够的蛋白结构信息的新靶点。
近日,英矽智能公司的研发团队就借助AlphaFold,针对一个缺乏可用蛋白结构信息的新型靶点,开发出潜在的全球首创(first-in-class)苗头化合物。目前该论文已上传至arXiv预印本平台。
在这项工作中,研发团队将AlphaFold应用于英矽智能开发的端到端AI药物发现引擎中,这个引擎由生物计算平台PandaOmics和生成化学平台Chemistry42组成。
其中,PandaOmics以来自组学和文本数据的信息为起点,将AI深度学习和生物信息学方法相结合,用于数据的分析、可视化和解读,判定基因与疾病靶点的关联性,从而找到有潜力的靶点。
不过,如果这些靶点没有明确的晶体结构,传统方法将难以继续开展研究。这时,AlphaFold的作用就体现了出来:它能够准确地预测蛋白结构,这样研究者就可以选择最具潜力的靶点,运用Chemistry42 平台设计苗头化合物。
▲研发团队将 AlphaFold与英矽智能的AI药物发现平台 PandaOmics 和 Chemistry42 相结合,针对肝细胞癌进行靶点发现与苗头化合物的设计和生成。(图片来源:参考资料[1])
在这项研究中,这个引擎寻找的是针对肝细胞癌的靶点。根据国际癌症研究机构 (IARC) 发布的全球癌症(GLOBOCAN)统计报告2020年版,原发性肝癌是全球第六大常见癌种,也是癌症死亡的第三大原因。肝细胞癌 (HCC) 是肝癌的主要类型,约占患者总人数的 75%。由于预后不佳,全球范围内肝癌的死亡率和发病率不相上下。
为了寻找治疗靶点,研发团队首先获取了包含1133 个患者样本和 674 个健康样本的肝细胞癌数据集。利用这些数据,PandaOmics筛选出20个有潜力的靶点。由于AlphaFold已经预测出这些靶点的晶体结构,PandaOmics可以基于靶点与疾病的关联度给出评分。这样,作者确定了得分最高的靶点——细胞周期蛋白依赖性激酶20(CDK20)。
已有研究发现,CDK20在结直肠癌、肝细胞癌、肺癌和卵巢癌等多种癌症患者的肿瘤样本中过度表达。这个分子通过多种方式促进肿瘤细胞的生长与增殖:它们不仅参与调节肿瘤细胞周期和致癌信号传导,还与某些肿瘤的免疫抑制相关。因此,尽管发现的时间不长, CDK20已经引起了广泛关注。CDK20 抑制剂一旦问世,将有望成为癌症,特别是肝细胞癌的创新疗法。
▲英矽智能针对CDK20靶点的苗头化合物生成过程(图片来源:参考资料[1])
但遗憾的是,尽管针对CDK家族其他部分成员的药物研发大获成功(例如多款CDK4/6抑制剂已经获批上市,用于治疗乳腺癌、肺癌等),但针对CDK20抑制剂的研发尚未出现。一个重要原因就在于,CDK20没有可用的蛋白结构信息。在这项最新研究中,基于Alphafold 预测的蛋白结构,Chemistry42成功设计、生成了潜在的CDK20 抑制剂。
▲A) CDK20的 AlphaFold 预测结构;B) CDK20 的 ATP 结合口袋(图片来源:参考资料[1])
Chemistry42从预测的蛋白结构中发现,CDK20有一个较浅的ATP结合口袋。结合这个口袋的结构特性,Chemistry42设计并生成了8918种分子结构,并且最终筛选出7个最具潜力的化合物进行合成。
▲Chemistry42生成的7 个分子的化学结构(图片来源:参考资料[1])
通过进一步的评估,研发团队发现在7个候选化合物中,化合物ISM042-2-001与CDK20结合的能力极强。研发团队随后预测了其结合模式,基于这一模式,研发团队目前正在对ISM042-2-001进行更多衍生物的设计与合成,以进一步提高酶活性。
在这篇论文里,研发团队展示了将AlphaFold与AI引擎PandaOmics和Chemistry42相结合,在30天内完成了靶点选择、分子生成、化合物合成和生物学测试,最终快速发现有望治疗肝细胞癌的苗头化合物分子。目前,对该分子的进一步优化仍在进行中。这项研究也是将 AlphaFold 预测的蛋白结构用于药物研发的一个实例,之后英矽智能也会继续公布对其他靶点类型(如GPCR和E3连接酶)的进一步研究。
参考资料:
[1] Feng Ren et al., AlphaFold Accelerates Artificial Intelligence Powered Drug Discovery: Efficient Discovery of a Novel Cyclin-dependent Kinase 20 (CDK20) Small Molecule Inhibitor. arXiv:2201.09647
AlphaFold蛋白质结构预测协助发现首个CDK20的小分子抑制剂相关推荐
- Chem. Sci.|AlphaFold加速了人工智能药物的发现:一种新型CDK20小分子抑制剂
题目:AlphaFold accelerates artificial intelligence powered drug discovery: efficient discovery of a ...
- MCE公司:首个TLR8小分子抑制剂问世,或将治愈自身免疫病
作为TLRs家族中与自身免疫性疾病密切相关的受体TLR8,近年来逐步受到重视,目前已经发现了不少TLR8小分子激活剂,但其抑制剂一直未被发现.而最新的一项研究则填补了这项空白. Toll样受体(Tol ...
- 后AlphaFold时代的蛋白质结构预测
最新一届的蛋白质结构预测奥林匹克大赛,即15届CASP比赛(CASP15),在日前拉下了帷幕.这正值谷歌团队AlphaFold2在上一届CASP大赛给该领域带来革命性冲击后两周年.两年后,该领域的状况 ...
- 手把手教程 | 使用AlphaFold进行蛋白质结构预测,探索生命信息密码
AlphaFold是一个能根据蛋白质序列预测构象的深度学习模型,2021年7月,DeepMind开源了升级版本AlphaFold v2.0,本文简要描述了如何在亚马逊云科技上使用AlphaFold进行 ...
- 谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具
新智元报道 ,来源:nature Science nature和Science两本杂志一直相爱相杀,总是喜欢争着发表科学领域中的重大发现.重要突破,抢夺大师文章的发表版权. 这次也不例外. 7月1 ...
- 清华AI蛋白质结构预测,连续4周夺得CAMEO第一
衡宇 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI AI蛋白质结构预测赛道,国产模型又有吸睛表现: 在蛋白质结构预测竞赛CAMEO上,有支队伍连续四周夺得全球第一. 达成这一成就的是来自清华大 ...
- Google Research进军蛋白质结构预测:为Pfam数据库新增680万标注数据
视学算法报道 编辑:LRS [新智元导读]用深度学习模型来预测蛋白质的结构和功能已经取得了不小的进展,但还缺乏优质的数据.最近Google开源了一个模型ProtENN,提供了680万条蛋白质结 ...
- AlphaFold2被超越!中国团队刷新全球蛋白质结构预测纪录,大牛彭健创业项目一鸣惊人...
雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitAI AlphaFold2的纪录,刚刚被刷新了. 最新消息,全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Mode ...
- DeepMind攻破生物学领域50年难题:蛋白质结构预测准确性可达92.4分
译者 | 刘畅 来源 | Google博客 导语:蛋白质的形状与其功能密切相关,能够预测这种结构可使人们更好地了解它的功能和工作原理,从而突破世界上许多强有力的挑战,如开发疾病治疗方法或寻找分解工业废 ...
最新文章
- php循环给数组每个值加引号,php数组非数字键名加引号的必要性!
- GDCM:gdcm::FileChangeTransferSyntax的测试程序
- 累积分布函数_C7: 概率函数和分布函数Distribution Function
- 前端开发必须说的那些事之——同源策略(same origin policy)
- pytorch学习笔记(十六):Parameters
- <2012 12 17> “Kernel panic - not syncing” 问题的解决
- 网易云音乐 linux x32,网易云音乐 for Mac
- Python中的角度转换功能
- VB简易绘图板的实现
- PHP 将两个MP3 文件进行合并,可以多个MP3文件合并
- 【postgresql】 获取月初月末日期
- C#画布的创建和圆的画法
- java 在线 excel文件_Java实现最简单的在线打开保存Excel文件 - PageOffice
- HTML重点知识小结①
- 清理注册表 php,win10系统如何清理自带注册表
- c++ 实现职工管理系统
- 如何安装nginx第三方模块--add-module
- 【Python】用Python绘制折线图(插值法平滑曲线)
- 判断三极管电路能否放大交流信号
- Mac 下IDEA无法启动的问题的解决