来源:专知
本文1000字,建议阅读5分钟TransPHLA设计了Transformer衍生模型来预测pHLA的结合。

近日,国际知名期刊《Nature Machine Intelligence》在线发表了上海交通大学生命科学技术学院魏冬青团队的研究论文《A transformer-based model to predict peptide–HLA class I binding and optimize mutated peptides for vaccine design》。生命科学技术学院2017级博士研究生褚晏伊和香港大学深圳医院的张艳博士为该论文的共同第一作者。生命科学技术学院魏冬青教授和熊毅副研究员为该论文的共同通讯作者。

人类白细胞抗原(HLA)和肽(pHLA)之间相互作用的计算预测可以加快表位筛选和疫苗。该研究开发了TransMut框架,包含了用于pHLA结合预测的TransPHLA和用于突变肽优化的AOMP程序,它可以推广到生物分子的任何结合和突变任务(图1)。

TransPHLA设计了Transformer衍生模型来预测pHLA的结合。在pHLA结合预测、新抗原鉴定和HPV疫苗鉴定方面,TransPHLA均优于现有的14种方法。基于TransPHLA开发的AOMP程序可用于疫苗设计,它可以自动优化突变肽,以搜索对目标HLA具有更高亲和力并与源肽具有高度同源性的突变肽。在3660个非结合pHLA中,有3630个源肽被成功突变。其中,94%通过IEDB的推荐方法得到验证,88%与源肽的同源性高于80%。

图1.TransMut框架在webserver上的输入和输出

1.数据集

该研究包含112种HLA,肽长度从8到14,共有366种HLA-肽长度组合。详情见图2和图3。

图2.不同数据集中每个HLA相关的可结合的pHLA样本数

图3.不同数据集中肽长度相关的可结合的pHLA样本数

2.TransPHLA模型

TransPHLA的核心思想是自注意力机制的应用。TransPHLA由以下四个模块组成(图4):首先使用embedding block将positional embedding添加到amino acid embedding中,以生成sequence embedding,然后应用dropout技术来增强鲁棒性。通过embedding block,TransPHLA分别生成肽和HLA的embedding。接下来,这些embedding将分别作为Encoder block的输入。Encoder block包含masked multi-head self-attention mechanism和feature optimization block。Feature optimization block是先上升后下降的全连接层的组合,这个模块使得注意力机制得到的特征表示更好。然后,将输出的肽和HLA的特征表示连接,作为pHLA的embedding。在pHLA的embedding通过encoder block后,使用projection block预测pHLA的结合分数。

图4.TransPHLA模型图

论文链接:

https://www.nature.com/articles/s42256-022-00459-7

参考链接:

https://news.sjtu.edu.cn/jdzh/20220325/169006.html

【Nature. Mach. Intell. 】基于Transformer的多肽-HLA I类结合预测和疫苗的新生抗原序列设计...相关推荐

  1. Nat. Mach. Intell. | 基于神经网络的迁移学习用于单细胞RNA-seq分析中的聚类和细胞类型分类...

    今天给大家介绍由美国宾夕法尼亚大学佩雷尔曼医学院生物统计学,流行病学和信息学系Jian Hu等人在<Nature Machine Intelligence>上发表了一篇名为"It ...

  2. Nat. Mach. Intell. | 基于深度学习预测DNA甲基化位点

    研究人员开发了一种预测DNA甲基化位点的机器学习算法可以帮助识别致病机制.该论文2020年8月3日发表在"Nature Machine Intelligence"上. 研究人员通过 ...

  3. Nat. Mach. Intell. | 基于深度强化学习寻找网络中的关键节点

    今天给大家介绍哈佛大学Yang-Yu Liu课题组和加利福尼亚大学洛杉矶分校Yizhou Sun课题组发表在nature machine intelligence上的一篇文章"Finding ...

  4. NLP实操手册: 基于Transformer的深度学习架构的应用指南(综述)

    翻译来自百分点认知智能实验室 易显维 桂安春 本文翻译自The NLP Cookbook: Modern Recipes for Transformer based Deep Learning Arc ...

  5. Nat. Mach. Intel. | ReLSO: 具有正则化潜在空间优化的基于Transformer的蛋白生成

    今天介绍一篇由耶鲁大学Egbert Castro等人于2022年9月26日发表在nature machine intelligence上的文章.本文引入了正则化潜在空间优化(ReLSO),这是一种基于 ...

  6. Nat. Mach. Intell. | FFPred-GAN:“以假乱真“—基于GAN创建合成特征样本改进蛋白质功能预测...

    今天给大家介绍伦敦大学学院David T. Jones 教授课题组发表在Nature Machine Intelligence 的一篇文章.文章中指出,现存的蛋白质功能预测方法受限于训练样本量的瓶颈, ...

  7. 专家点评Nat Mach Intell | 刘琦团队开发基于元学习的AI模型进行抗原-TCR亲和力识别及肿瘤新生抗原免疫原性预测...

    T细胞受体(T-cell receptor, TCR)是获得性免疫过程中的关键分子.TCR经过特定的基因重组和进化筛选,具备高度的多样性及特异性.MHC-多肽复合物与TCR亲和力的计算识别(pMHC- ...

  8. Nat.Mach.Intell.|如何改进错义突变致病性预测?使用图注意神经网络试试

    编译 | 杨慧丹 审稿 | 赵宸 本文介绍一篇来自哥伦比亚大学Yufeng Shen的研究团队最近发表在Nature Machine intelligence期刊上的一项研究.作者提出了一种基于图注意 ...

  9. Nat. Mach. Intell. | 深度神经网络中的捷径学习

    今天给大家介绍来自德国蒂宾根大学的Robert Geirhos和加拿大多伦多大学的Claudio Michaelis等人发表在Nature Machine Intelligence的文章"S ...

最新文章

  1. shardingjdbc全局表_Sharding-JDBC 分库分表概述
  2. Android SwipeRefreshLayout 官方下拉刷新控件介绍
  3. java synchronized关键字_Java:手把手教你全面学习神秘的Synchronized关键字
  4. psql+加载mysql数据库_Go实战--go语言操作PostgreSQL数据库(github.com/lib/pq)
  5. SAP GUI和Windows注册表
  6. 一个简单的LINQ TO XML, AJAX 例子[译]
  7. java继承层次结构,在状态模式中实现继承层次结构 - java
  8. NLP复习资料(3)-六~七章:马尔科夫模型与条件随机场、词法分析与词性标注
  9. 【节流】在vue的搜寻功能中使用节流
  10. 面试官:有没有比读写锁更快的锁?
  11. 华为交换机开启ftp服务,上传和下载文件,get和put操作实例
  12. Adobe Illustrator for Mac 2020 24.0.1版 — 矢量绘图工具
  13. Xshell、MobaXterm、Secure CRT等工具用法
  14. SXF2019长方体的摆放
  15. 挂耳式耳机品牌排行榜,看看谁被推荐上榜
  16. 编写跨平台Java程序注意事项
  17. Python每日一练(13)-IQ智商判断及测试
  18. 计算机打音乐两只老虎,两只老虎(音乐、汇编程序)
  19. BootLoader——嵌入式系统的引导加载程序
  20. js 在一个日期上面加上指定时间(几小时、几分钟、几秒)

热门文章

  1. 如何在linux系统下使用百度云盘上传下载文件?
  2. 计算机与数学交融的教学设计,信息技术与小学数学学科的整合 小学数学教案...
  3. 百度AI攻略:人体关键点识别
  4. 白酒知识丨酱香型白酒为何瓶子不透明?
  5. 5个常用的上传图片进行搜索的网站
  6. 逆---LanSet.exe
  7. RK3288 Android7.1 接USB摄像头后扬声器无声音
  8. 今年天猫双11从光棍节变成双节棍:可买4天,11月1日开买
  9. python package 之 jenkins
  10. APP2SD图文储存卡分区教程