摘要:近期,中科院上海药物所、上海科技大学联合华为云医疗智能体团队,在Science China Life Sciences 发表题为“Facing Small and Biased Data Dilemma in Drug Discovery with Enhanced Federated Learning Approaches”的文章。

本文分享自华为云社区《中科院上海药物所/上海科技大学、华为云联合团队发布个性化联邦学习算法框架,赋能AI药物研发》,作者: 华为云头条 。

文章来源:中国科学杂志社

药物研发是一个漫长的过程,传统的药物研发需要投入大量的研发人员,并且花费十到十五年,数十亿美元的研发经费才能使一个药物走向上市。近些年来,随着AI、大数据和云计算等技术的发展,越来越多的制药公司和科技巨头把目光投到这一领域。然而AI药物研发面临着一系列困难和挑战,AI模型需要大量的数据进行建模,而药物研发数据的高壁垒、高成本、高机密性影响到了制药公司数据贡献的积极性。同时,数据孤岛现象普遍存在,很多企业内部的数据都是量少而且高度有偏的,这给高质量的AI药物研发模型带来很大的挑战。近年来新兴的联邦学习可以很好的解决这个问题。联邦学习本质上是一种分布式机器学习技术,其目标是在保证数据隐私安全合规的基础上,实现共同建模。在联邦学习框架下,多家药企之间无需共享数据,仅通过共享模型权重,来实现药企之间协同训练,在保证数据安全的同时彼此增强AI模型的效果。

近期,中科院上海药物所、上海科技大学联合华为云医疗智能体团队,在Science China Life Sciences 发表题为“Facing Small and Biased Data Dilemma in Drug Discovery with Enhanced Federated Learning Approaches”的文章。联合团队使用三个任务来模拟跨数据孤岛的联合学习过程:基于化学结构进行药物溶解度、激酶抑制活性和hERG心脏毒性的预测。这些数据涵盖了不同的药物化学空间、实验测量方法、实验条件和数据大小,代表真实世界中不同制药公司的数据分布的差异。借此,来研究联邦学习对打破数据孤岛的意义,并从分析结果中发现,联邦学习的效果均优于单独数据来源的模型训练。

接着,为进一步提升模型效果,联合团队引入了残差全连接网络(RFCN),通过利用AI自动建模工具AutoGenome1,对三个任务重新训练以获得更精确的模型骨架;另外,在联邦模型参数整合策略中联合团队引入了个性化联邦学习(FedAMP)2,为联邦计算参与者训练个性化模型,并且通过注意力消息传递机制加强具有相似数据分布的参与者之间的协同,使得数据贡献越多、质量越好的参与方获益也越大;在激酶抑制活性预测的性能对比我们可以看到,RFCN和FedAMP的引入,在药物溶解度、激酶抑制活性和hERG心脏毒性预测这三个AI任务上,均优于传统MLP和FedAvg方法。

近日,上海药物所/上海科技大学和华为云医疗智能体,联合发布基于华为云ModelArts平台的药物联邦学习服务,来帮助药企和研究机构更加方便的使用药物联邦学习,通过简单的四步操作,参与联邦学习的用户就可以便捷的实现联邦训练:第一步:盟主创建联盟,定义联邦任务,如药物结构预测水溶解度;第二步:盟主邀请参与者加入联邦,参与者同意加入;第三步:联邦成员部署代理,配置联邦运行环境;第四步:盟主启动联邦任务,开始联邦作业训练。

华为云医疗智能体EIHealth基于华为云AI昇腾集群服务、华为云一站式AI开发平台ModelArts的强大AI能力,集成了医药领域众多算法、工具、AI模型和自动化流水线,目标是打造一个全栈、开放、专业的医疗行业企业级AI研发平台。 更多信息请访问 : https://www.huaweicloud.com/product/eihealth.html

参考文献

1. Liu, D. et al. AutoGenome: An AutoML Tool for Genomic Research. bioRxiv 842526 (2019) doi:10.1101/842526.2. Huang, Y. et al. Personalized Cross-Silo Federated Learning on Non-IID Data. arXiv:2007.03797 [cs, stat] (2021).

点击关注,第一时间了解华为云新鲜技术~

个性化联邦学习算法框架发布,赋能AI药物研发相关推荐

  1. 个性化联邦学习PFedMe详细解读(NeurIPS 2020)

    关注公众号,发现CV技术之美 本文介绍一篇 NeurIPS 2020 的论文『Personalized Federated Learning with Moreau Envelopes』,对个性化联邦 ...

  2. 群体智能中的联邦学习算法综述

    摘要 群体智能是在互联网高速普及下诞生的人工智能新范式.然而,数据孤岛与数据隐私保护问题导致群体间数据共享困难,群体智能应用难以构建.联邦学习是一类新兴的打破数据孤岛.联合构建群智模型的重要方法.首先 ...

  3. 虚拟专题:联邦学习 | 联邦学习算法综述

    来源:大数据期刊 联邦学习算法综述 王健宗1 ,孔令炜1 ,黄章成1 ,陈霖捷1 ,刘懿1 ,何安珣1 ,肖京2 1. 平安科技(深圳)有限公司,广东 深圳 518063 2. 中国平安保险(集团)股 ...

  4. 跟我学ModelArts丨探索ModelArts平台个性化联邦学习API

    摘要:ModelArts提供了一个实现个性化联邦学习的API--pytorch_fedamp_emnist_classification,它主要是让拥有相似数据分布的客户进行更多合作的一个横向联邦学习 ...

  5. 联邦学习开源框架FATE

    FATE (Federated AI Technology Enabler) 是微众银行AI部门发起的全球首个联邦学习工业级开源框架,可以让企业和机构在保护数据安全和数据隐私的前提下进行数据协作. F ...

  6. 联邦学习开源框架方案选型

    无知者:[联邦学习开源框架]FedLab - 加速FL算法验证 联邦学习开源框架FedLab相关 FATE 单位:微众银行 github: https://github.com/FederatedAI ...

  7. 联邦学习开源框架调研

    文章目录 1. FATE 1.1 FederatedML 算法列表 1.2 FATE Serving 1.3 FATEFlow 1.4 FATEBoard 1.5 Federated Network ...

  8. 【个性化联邦学习】Towards Personalized Federated Learning 论文笔记整理

    Towards Personalized Federated Learning 一.背景 二.解决策略 2.1 策略一.全局模型个性化 2.2 策略二.学习个性化模型 三.具体方案 3.1 全局模型个 ...

  9. 联邦学习开源框架简介

    0.FATE平台 该平台是微众银行开发的,是全球第一个联邦学习工业级开源框架.不管是对初级人门者,还是联邦学习产品级系统的开发人员,FATE都是一个非常合适的选择.相比于利用Python从零开发,FA ...

最新文章

  1. android apk签名工具_关于keytool和jarsigner工具签名的使用小结
  2. linux两种方式改变文件权限,Linux更改文件权限的两种方式
  3. 编程之美-连连看游戏设计方法整理
  4. poj 3616(简单dp)
  5. 「前端早读君007」css进阶之彻底理解视觉格式化模型
  6. 面向对象之类的内建函数
  7. Android笔记 fragment的Tab样式demo
  8. mysql还要mysqldump的备份文件到指定数据库
  9. 查询同一组的最大最小值及明细
  10. Java List 中的set add
  11. FireBug使用方法
  12. wps演示怎么提高列表级别_wps文字如何设置标题级别?wps设置标题级别教程
  13. springboot引入validation
  14. C语言alloc函数总结
  15. bmp怎样转成jpg?
  16. frame组件+pack()来布局定位组件,实例讲解
  17. 关于禁止html缓存
  18. Apple LZF算法解析
  19. 【Hyper-V】Windows10家庭版安装Hyper-V虚拟机
  20. php html钓鱼源码,PHP全新仿QQ空间钓鱼源码

热门文章

  1. Linux中sudo免密码
  2. CSS 动态超链接样式 LVFHA 或 LVHFA
  3. es6 Class 不存在变量提升
  4. 集群搭建在一台计算机上,服务器集群
  5. java不能打开串口_java打不开串口,我已经放入那两个文件了,但是报错了,调用不了...
  6. python线性输出_Python实现基本线性数据结构
  7. java备份mysql数据库备份_Java实现MySQL数据库备份
  8. 如何使用go打出hell word
  9. L1-046 整除光棍
  10. 星期三—用JAVA制作简易的通讯软件