近年来,AlphaFold的横空出世在结构生物学领域实现了一场变革。这种能准确预测蛋白结构的AI系统,已经应用于生命科学研究的各个场景。去年7月,AlphaFold预测出98.5%的人类蛋白结构;现在,AlphaFold又站上了药物研发的战线。其预测的结构可以促进基于结构的药物设计,特别是对于那些缺乏足够的蛋白结构信息的新靶点。

近日,英矽智能公司的研发团队就借助AlphaFold,针对一个缺乏可用蛋白结构信息的新型靶点,开发出潜在的全球首创(first-in-class)苗头化合物。目前该论文已上传至arXiv预印本平台。

在这项工作中,研发团队将AlphaFold应用于英矽智能开发的端到端AI药物发现引擎中,这个引擎由生物计算平台PandaOmics和生成化学平台Chemistry42组成。

其中,PandaOmics以来自组学和文本数据的信息为起点,将AI深度学习和生物信息学方法相结合,用于数据的分析、可视化和解读,判定基因与疾病靶点的关联性,从而找到有潜力的靶点。

不过,如果这些靶点没有明确的晶体结构,传统方法将难以继续开展研究。这时,AlphaFold的作用就体现了出来:它能够准确地预测蛋白结构,这样研究者就可以选择最具潜力的靶点,运用Chemistry42 平台设计苗头化合物。

▲研发团队将 AlphaFold与英矽智能的AI药物发现平台 PandaOmics 和 Chemistry42 相结合,针对肝细胞癌进行靶点发现与苗头化合物的设计和生成。(图片来源:参考资料[1])

在这项研究中,这个引擎寻找的是针对肝细胞癌的靶点。根据国际癌症研究机构 (IARC) 发布的全球癌症(GLOBOCAN)统计报告2020年版,原发性肝癌是全球第六大常见癌种,也是癌症死亡的第三大原因。肝细胞癌 (HCC) 是肝癌的主要类型,约占患者总人数的 75%。由于预后不佳,全球范围内肝癌的死亡率和发病率不相上下。

为了寻找治疗靶点,研发团队首先获取了包含1133 个患者样本和 674 个健康样本的肝细胞癌数据集。利用这些数据,PandaOmics筛选出20个有潜力的靶点。由于AlphaFold已经预测出这些靶点的晶体结构,PandaOmics可以基于靶点与疾病的关联度给出评分。这样,作者确定了得分最高的靶点——细胞周期蛋白依赖性激酶20(CDK20)。

已有研究发现,CDK20在结直肠癌、肝细胞癌、肺癌和卵巢癌等多种癌症患者的肿瘤样本中过度表达。这个分子通过多种方式促进肿瘤细胞的生长与增殖:它们不仅参与调节肿瘤细胞周期和致癌信号传导,还与某些肿瘤的免疫抑制相关。因此,尽管发现的时间不长, CDK20已经引起了广泛关注。CDK20 抑制剂一旦问世,将有望成为癌症,特别是肝细胞癌的创新疗法。

▲英矽智能针对CDK20靶点的苗头化合物生成过程(图片来源:参考资料[1])

但遗憾的是,尽管针对CDK家族其他部分成员的药物研发大获成功(例如多款CDK4/6抑制剂已经获批上市,用于治疗乳腺癌、肺癌等),但针对CDK20抑制剂的研发尚未出现。一个重要原因就在于,CDK20没有可用的蛋白结构信息。在这项最新研究中,基于Alphafold 预测的蛋白结构,Chemistry42成功设计、生成了潜在的CDK20 抑制剂。

▲A) CDK20的 AlphaFold 预测结构;B) CDK20 的 ATP 结合口袋(图片来源:参考资料[1])

Chemistry42从预测的蛋白结构中发现,CDK20有一个较浅的ATP结合口袋。结合这个口袋的结构特性,Chemistry42设计并生成了8918种分子结构,并且最终筛选出7个最具潜力的化合物进行合成。

▲Chemistry42生成的7 个分子的化学结构(图片来源:参考资料[1])

通过进一步的评估,研发团队发现在7个候选化合物中,化合物ISM042-2-001与CDK20结合的能力极强。研发团队随后预测了其结合模式,基于这一模式,研发团队目前正在对ISM042-2-001进行更多衍生物的设计与合成,以进一步提高酶活性。

在这篇论文里,研发团队展示了将AlphaFold与AI引擎PandaOmics和Chemistry42相结合,在30天内完成了靶点选择、分子生成、化合物合成和生物学测试,最终快速发现有望治疗肝细胞癌的苗头化合物分子。目前,对该分子的进一步优化仍在进行中。这项研究也是将 AlphaFold 预测的蛋白结构用于药物研发的一个实例,之后英矽智能也会继续公布对其他靶点类型(如GPCR和E3连接酶)的进一步研究。

参考资料:
[1] Feng Ren et al., AlphaFold Accelerates Artificial Intelligence Powered Drug Discovery: Efficient Discovery of a Novel Cyclin-dependent Kinase 20 (CDK20) Small Molecule Inhibitor. arXiv:2201.09647

AlphaFold蛋白质结构预测协助发现首个CDK20的小分子抑制剂相关推荐

  1. Chem. Sci.|AlphaFold加速了人工智能药物的发现:一种新型CDK20小分子抑制剂

    ​ 题目:AlphaFold accelerates artificial intelligence powered drug discovery: efficient discovery of a ...

  2. MCE公司:首个TLR8小分子抑制剂问世,或将治愈自身免疫病

    作为TLRs家族中与自身免疫性疾病密切相关的受体TLR8,近年来逐步受到重视,目前已经发现了不少TLR8小分子激活剂,但其抑制剂一直未被发现.而最新的一项研究则填补了这项空白. Toll样受体(Tol ...

  3. 后AlphaFold时代的蛋白质结构预测

    最新一届的蛋白质结构预测奥林匹克大赛,即15届CASP比赛(CASP15),在日前拉下了帷幕.这正值谷歌团队AlphaFold2在上一届CASP大赛给该领域带来革命性冲击后两周年.两年后,该领域的状况 ...

  4. 手把手教程 | 使用AlphaFold进行蛋白质结构预测,探索生命信息密码

    AlphaFold是一个能根据蛋白质序列预测构象的深度学习模型,2021年7月,DeepMind开源了升级版本AlphaFold v2.0,本文简要描述了如何在亚马逊云科技上使用AlphaFold进行 ...

  5. 谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具

     新智元报道  ,来源:nature Science nature和Science两本杂志一直相爱相杀,总是喜欢争着发表科学领域中的重大发现.重要突破,抢夺大师文章的发表版权. 这次也不例外. 7月1 ...

  6. 清华AI蛋白质结构预测,连续4周夺得CAMEO第一

    衡宇 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI AI蛋白质结构预测赛道,国产模型又有吸睛表现: 在蛋白质结构预测竞赛CAMEO上,有支队伍连续四周夺得全球第一. 达成这一成就的是来自清华大 ...

  7. Google Research进军蛋白质结构预测:为Pfam数据库新增680万标注数据

      视学算法报道   编辑:LRS [新智元导读]用深度学习模型来预测蛋白质的结构和功能已经取得了不小的进展,但还缺乏优质的数据.最近Google开源了一个模型ProtENN,提供了680万条蛋白质结 ...

  8. AlphaFold2被超越!中国团队刷新全球蛋白质结构预测纪录,大牛彭健创业项目一鸣惊人...

    雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitAI AlphaFold2的纪录,刚刚被刷新了. 最新消息,全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Mode ...

  9. DeepMind攻破生物学领域50年难题:蛋白质结构预测准确性可达92.4分

    译者 | 刘畅 来源 | Google博客 导语:蛋白质的形状与其功能密切相关,能够预测这种结构可使人们更好地了解它的功能和工作原理,从而突破世界上许多强有力的挑战,如开发疾病治疗方法或寻找分解工业废 ...

最新文章

  1. php循环给数组每个值加引号,php数组非数字键名加引号的必要性!
  2. GDCM:gdcm::FileChangeTransferSyntax的测试程序
  3. 累积分布函数_C7: 概率函数和分布函数Distribution Function
  4. 前端开发必须说的那些事之——同源策略(same origin policy)
  5. pytorch学习笔记(十六):Parameters
  6. <2012 12 17> “Kernel panic - not syncing” 问题的解决
  7. 网易云音乐 linux x32,网易云音乐 for Mac
  8. Python中的角度转换功能
  9. VB简易绘图板的实现
  10. PHP 将两个MP3 文件进行合并,可以多个MP3文件合并
  11. 【postgresql】 获取月初月末日期
  12. C#画布的创建和圆的画法
  13. java 在线 excel文件_Java实现最简单的在线打开保存Excel文件 - PageOffice
  14. HTML重点知识小结①
  15. 清理注册表 php,win10系统如何清理自带注册表
  16. c++ 实现职工管理系统
  17. 如何安装nginx第三方模块--add-module
  18. 【Python】用Python绘制折线图(插值法平滑曲线)
  19. 判断三极管电路能否放大交流信号
  20. Mac 下IDEA无法启动的问题的解决

热门文章

  1. 学会使用DM8的间隔分区
  2. 未来,老子云一站式“实景buy”齐常用家居用品
  3. Python3 02 数字(Number)、字符串、列表、元组、字典
  4. icp备案和域名备案两者之间有什么区别?
  5. 哈工大历年C语言测试题,哈工大C语言期末试题2005年C.doc
  6. 【Mysql】DQL语法及其使用
  7. 远光软件与飞腾加强生态合作 赋能信创技术选型
  8. ZJGSU OJ 2499 密码情书
  9. 顺丰菜鸟之争!物流APP开发亟待提升末端服务问题
  10. 求1到N的阶乘的倒数和