2021最大看点AI for Science,在哪些领域有斩获?
【专栏:前沿进展】AI for Science是今年一大重点发展的新兴领域。中科院院士,北京大学教授鄂维南在2021年智源大会上表示:“传统的科研领域如化学、材料、电子工程、化学工程、机械工程等等,应该成为人工智能的主战场,或许不仅仅是主战场,很可能是未来十年最大的主战场。”AI for Science也被阿里达摩院评为2022年十大科技趋势之一。
回顾一年来的发展,AI在数学、物理学、量子化学、生物学、材料学等领域均取得了进步。作为2021年终盘点,智源社区整理今年AI for Science领域的发展情况和案例,形成《智源人工智能前沿报告》(AI Frontiers Report),预计将于2021年末发布,敬请期待。本篇文章来自该报告AI for Science技术相关板块。
撰文:戴一鸣
审校:熊宇轩
本文感谢中国人民大学魏哲巍教授提供的案例支持。
01
传统科研领域成为人工智能发展的“新战场”
近年来,人工智能在科研领域被初步应用,越来越多的科学家自研或采用成熟的人工智能算法,辅助进行数据挖掘分析、建模、仿真、预测等科研工作,加快发现自然科学新规律、新模式,减少重复性人力工作,提升科学发现的准确性,显著提高科研人员的工作效率。
目前,人工智能已在物理学、化学、材料学、生物学等领域得到应用,如2020年11月“深度势能”团队获得戈登·贝尔奖(Gordon Bell Prize),AlphaFold2破解蛋白质折叠预测难题等。随着人工智能技术和科学研究的结合愈发紧密,已出现了“AI for Science”(人工智能科学研究)的新兴研究领域。
案例1:DeepMind开源AlphaFold2蛋白质预测算法和数据库/华盛顿大学等提出并开源蛋白质预测算法RoseTTAFold
7月,DeepMind使用新开发的AlphaFold2算法预测出了35万种蛋白质的结构,其中包括人类基因组表达的约2万种蛋白质,以及其他20种生物学研究中的常用模式生物(如大肠杆菌、酵母和果蝇)表达的蛋白质,是过去用实验方法解决的蛋白质数量的两倍多。
研究发现,AlphaFold2能对人类蛋白质组中58%的氨基酸结构位置给出可信预测。35.7%的结构位置的预测达到了高置信度,是实验方法覆盖结构数量的两倍。在蛋白层面,AlphaFold2对43.8%的蛋白中至少四分之三的氨基酸序列都给出了可信预测,该研究于7月22日登上《自然》杂志。
DeepMind宣布,已与欧洲生物信息研究所(EMBL-EBI)合作建立AlphaFold DB蛋白质结构数据库,将覆盖98.5%的人类蛋白质信息,预测结果免费开放。12月,这项研究被《自然》杂志评为2021年度技术突破。
图注:AlphaFold2模型在多种物质上预测结果的置信区间
来源:https://www.nature.com/articles/s41586-021-03828-1
7月,华盛顿大学、哈佛大学等的研究者提出蛋白质结构预测算法RoseTTAFold,该方法基于深度学习,通过在蛋白质序列信息的学习,能够快速生成蛋白质的精确结构,减少传统方法在实验测定等方面投入的时间和精力。目前该算法已开源。
图注:RoseTTAFold中用于预测蛋白质结构的一系列算法架构
来源:https://www.science.org/doi/abs/10.1126/science.abj8754
案例2:加州大学圣地亚哥分校研究者提出基于机器学习的材料筛选方法
1月,来自加州大学圣地亚哥分校等机构的研究者提出了一种名为“Multi-fidelity Materials Graph Networks”(多精度材料图网络)的机器学习方法,通过学习来自多种测量和仿真来源的数据,通过AI模型预测材料的特性。该方法能够构建出具有普遍意义、更准确的“材料属性模型”,从而帮助科学家筛选有研究前景的候选材料。
图注:多保真度材料图网络处理材料学数据和进行属性建模的方法
来源:https://www.nature.com/articles/s43588-020-00002-x
案例3:谷歌研究者利用深度学习改进用于建模二维湍流的计算流体动力学中的近似结果
1月,谷歌的研究者使用端到端深度学习方法改进用于建模二维湍流的计算流体动力学中的近似结果(Approximations)。在湍流的直接数值仿真(Direct Numerical Simulation,DNS)和大涡仿真(Large Eddy Simulation,LES)方面,该方法在每个空间维度的分辨率是前者的8-10倍,实现了40-80倍的计算加速。
图注:该研究提出方法与结果概览:a)精确度和计算成本之间的关系(蓝线:基线方法;红线:机器学习方法);b)训练数据集和生成数据集的结果;c)该方法采用的端到端深度学习网络和处理数据的流程。
来源:https://arxiv.org/pdf/2102.01010.pdf
案例4:DeepMind、谷歌研究者基于神经网络算法改进混合整数编程求解器
7月,DeepMind和谷歌的研究者提出神经网络算法,对常见的混合整数编程(Mixed Integer Programming:MIP)求解器(如SCIP)进行改进,并应用于MIP求解器的两个关键子任务。该工作根据求解器生成的高质量变量分配(Assignment)和最优(Optimal)分配之间的目标值差异(Gap in Objective Value)来衡量性能。
相比原有的求解器的平均原始对偶差(Primal-dual gap),通过机器学习增强的SCIP在3个具有最大MIP的数据集(一共有5个数据集)上实现了1.5x、2x和104x的较优差(Better Gap),在第4个数据集上以5x的速度更快实现10%的差距,在第5个数据集上取得了与SCIP不相上下的表现。
图注:该方法采用的算法架构
来源:https://arxiv.org/pdf/2012.13349.pdf
案例5:CMU研究者提出超图表示学习算法诠释人体基因组折叠方式
10月,卡内基梅隆大学(CMU)计算生物学系(CBD)的研究者提出了一种基于超图表示学习(Hypergraph Representation Learning)的算法“Higashi”,可以诠释人体细胞核中基因组的折叠方式,以及这些折叠方式如何影响基因表达,论文发表于10月的《自然》杂志上。
图注:Higashi框架的整体结构
来源:https://www.nature.com/articles/s41587-021-01034-y
案例6:DeepMind提出AI应用于降雨预测的深度生成模型
10月,DeepMind在《自然》杂志发表论文,通过与英国气象局合作,将AI技术应用于降雨预测。研究者采用深度生成模型,可提前5-90分钟预测1536km×1280km区域内的降水情况。与其他方法对比,该模型在89%的情况下中具有最高的准确度和实用性(Usefulness)。
图注:DeepMind提出的AI模型架构
来源:https://www.nature.com/articles/s41586-021-03854-z
案例7:DeepMind研究者提出通过机器学习辅助发现数学猜想的方法
12月,DeepMind研究者提出采用机器学习辅助发现数学猜想和定理的方法。通过人工智能技术,我们能够发现数学目标中潜在的模式和关系,理解这些目标之间的属性机理,并帮助数学界寻找直觉和模式。
研究者通过人工智能技术成功帮助数学家进一步解决数学问题。例如:(1)扭结的代数和几何结构的新关联;(2)由对称群的组合不变性猜想预测出的候选函数。研究者认为,这一研究有助于形成一种数学和人工智能领域之间的协作模式,通过利用两个领域之间的优势,得到更加具有突破性的发现。
图注:DeepMind提出的用AI发现数学定理的流程,其中蓝色框为计算步骤,灰色框为数学家参与的步骤
来源:https://www.nature.com/articles/s41586-021-04086-x
案例8:DeepMind用深度学习算法解决密度泛函理论中的分数电子问题
过去30年,密度泛函理论(Density Functional Theory,DFT)已经成为最广泛使用的电子结构方法,用于预测多种化学、生物学、材料科学领域系统的属性。但是当前最先进的密度泛函理论方法存在局限。
12月,DeepMind研究者开发了深度学习算法,使用精确的化学数据和分数电子约束数据进行训练。训练后的模型函数能够超越传统函数在主族原子和分子基准上的表现。论文认为,这项工作为DFT中长期存在的关键问题提供了一个解决方案,并展示了将DFT和现在机器学习方法结合的成功性。
02
人工智能技术提升智能产品和服务的性能
案例1:DeepMind联合谷歌发布基于图神经网络的交通预测算法
人工智能能够催生出性能更强的产品和服务。9月,DeepMind联合谷歌发布了新的交通预测算法,其基于图神经网络,通过将地图信息转换为图节点和边,并使用图神经网络进行处理,能够大幅提高预计到达时间(Estimated Times of Arrival,ETAs)的准确度。
图注:采用图神经网络改善ETA的系统流程
来源:https://deepmind.com/blog/article/traffic-prediction-with-advanced-graph-neural-networks
图注:将道路转换为图的节点和边,并采用图神经网络进行处理的流程
来源:https://deepmind.com/blog/article/traffic-prediction-with-advanced-graph-neural-networks
图注:图神经网络对Google Map中全球多个城市的ETA预测的提升情况
来源:https://deepmind.com/blog/article/traffic-prediction-with-advanced-graph-neural-networks
欢迎点击阅读原文参与文章讨论。
2021最大看点AI for Science,在哪些领域有斩获?相关推荐
- AI for Science年度激辩:AlphaFold成功难以复制,数据人才生态建设都是挑战|MEET2023...
明敏 丰色 整理自 MEET2023 量子位 | 公众号 QbitAI "AI for Science在今年爆火,不是意外." "当下面临的最大挑战,是如何管理预期.&q ...
- AI for Science的上半场:人工智能如何重新定义科学研究新范式?
AI发展七十余年,每一技术性突破都将给人类未来开辟新一种可能性.而它与科学研究的深度融合,则会裂变出无数或无穷种可能性. 来源 :36氪 万众瞩目下,今年10月,有着诺贝尔奖"嫡传" ...
- AI for Science的上半场来了!
AI发展七十余年,每一技术性突破都将给人类未来开辟新一种可能性.而它与科学研究的深度融合,则会裂变出无数或无穷种可能性. 万众瞩目下,今年10月,有着诺贝尔奖"嫡传"之称的诺贝尔化 ...
- 达摩院年终预测重磅出炉:AI for Science 高居榜首,2022 十大科技趋势!
整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 作为"一所探索科技未知的研究院",阿里巴巴达摩院成立至今已经四年了. 这四年来,达摩院秉持着"探索科技位置 ...
- 你真的了解计算生物学和AI for Science吗?
来源:量子位 Q1:AlphaFold2的最大意义是什么? A1:这个看似突破性的进展,其实是技术演进的必然结果. 此外,如果我们换个视角来看待这个问题,蛋白质结构预测仅仅是计算生物学这个大门类里面 ...
- 达摩院年终预测出炉:2022 十大科技趋势,AI for Science 高居榜首
作为"一所探索科技未知的研究院",阿里巴巴达摩院成立至今已经四年了. 这四年来,达摩院秉持着"探索科技位置,以人类愿景为驱动力,开展基础科学和颠覆式技术创新研究" ...
- 达摩院年终预测出炉:AI for Science 高居榜首
达摩院年终预测重磅出炉:AI for Science 高居榜首,2022 十大科技趋势! 作为"一所探索科技未知的研究院",阿里巴巴达摩院成立至今已经四年了. 这四年来,达摩院秉持 ...
- 何恺明 MIT 最新演讲:未来工作将聚焦 AI for science
CV 人的大型追星现场来了. 来源 | AI科技评论 作者 | 黄楠 编辑 | 陈彩娴 又一名 AI 大神有了新动向! 当地时间3月13日下午3点,何恺明在MIT做学术演讲.据现场网友所述,即便自 ...
- 漫画丨AI for Science这事,到底“科学不科学”?
图文原创:谭婧 无奖问答,这里有三道送分题. 1.Science是什么? 参考答案:科学. 2.AI是什么? 参考答案:人工智能. 3.历史上哪三个物件影响人类科学发展? A.伽利略的铁球, B.牛顿 ...
最新文章
- Linux绝对权限和相对权限法,Linux基础学习笔记
- pandas使用query函数查询dataframe指定数据列的内容(数值)不包含在特定列表中的数据行(not contain in list)
- 【ARM】ARM汇编程序设计(六) stm和ldm
- King Gym - 102471H
- C/C++代码优化方法
- pdf怎么转换成word文字版
- 爬取qq音乐,js加密sign值无效,包含思路,遇到的各种问题要点
- 大数据在智慧城市建设中的应用
- chardet.detect()
- LoadRunner基础入门教程
- 基于stm32f103c8t6的Flash地址空间的数据读取
- 在verilog中将 .txt文件读入reg/将reg的数据写入.txt
- 根据交谈和3D面部表情判断抑郁症
- 什么是AI预训练模型?
- AutoJs学习-MC我的世界自动钓鱼
- UE4 快捷键--引擎篇
- 2016 GitHub章鱼猫观察报告之开源统计
- ubuntu18.04 cuda卸载及安装
- java $JAVA_OPTS -Djava.security.egd=file:/dev/./urandom -jar
- UDP搜索IP与端口
热门文章
- 归纳推理测试没做完_敷完面膜不要做4件事,不但敷了面膜没效果,皮肤还变差了...
- 苹果服务器消息转发,iphone-与APNS服务器进行交互以将推送通知发...
- r语言聚类分析_技术贴 | R语言pheatmap聚类分析和热图
- android manifest 权限组,Android的单个或多个权限动态申请
- python转盘抽奖_react 抽奖转盘 ----小计
- 安卓端和服务器端通信协议,安卓客户端和服务器如何通信协议
- js等待 callback 执行完毕_前端开发,一篇文章让你彻底搞懂,什么是JavaScript执行机制!...
- 对Julia社区不熟悉?创始人来告诉你
- Character流与Byte流的区别
- Mysql跨机房同步方案