作者:王可汗
校对:陈之炎本文约2000字,建议阅读5分钟本文解读了机器学习在分子动力学领域的最新研究,带你速读4篇相关领域的最新顶会论文。

分子动力学是现代计算凝聚态物理的重要力量,它经常用于模拟材料。当前,以机器学习为代表的人工智能技术在分子动力学的科学计算领域潜力巨大,展示出旺盛的生命力和光明前景。本文解读了机器学习在分子动力学领域的最新研究,带你速读4篇相关领域的最新顶会论文。

1.论文题目原文:

FORCES ARE NOT ENOUGH: BENCHMARK AND CRITICAL EVALUATION FOR MACHINE LEARNING FORCE FIELDS WITH MOLECULAR SIMULATIONS(IC3LR 202)

论文题目译文:分子模拟的机器学习力场基准和关键评估(ICLR 2023)

论文作者:麻省理工学院XiangFu∗、WujieWang、RafaelGomez-Bombarelli等

原文链接:https://arxiv.org/abs/2210.07237

图1:NequIP和Gemnet力场并不能再现对应体系的轨迹

内容简介:分子动力学模拟广泛应用于自然科学的各个领域。机器学习力场开始取代从头算第一性原理方法直接从分子的原子结构预测力,由于其兼顾计算速度与精度的优点,有望再现真实的分子动力学轨迹。然而,目前机器学习力场的评价标准都局限于力和能量的预测精度,这对于上述目标来说是远远不够的。作者选取了包括水,有机小分子,多肽和晶体材料在内的一系列体系,通过设计一系列描述轨迹稳定性的评价标准,说明了目前精度较高的一些机器学习力场并不能很好地再现轨迹。作者提出,稳定性应该成为机器学习力场评价的一个新标准。

2. 论文题目原文:Injecting Domain Knowledge from Empirical Interatomic Potentials to Neural Networks for Predicting Material Properties (NeurIPS 2022)

论文题目译文:将原子间势的经验域知识注入神经网络,用于预测材料特性(NeurIPS 2022)

论文作者:明尼苏达大学Zeren Shui、Daniel S. Karls、Ilia A. Nikiforov、Ellad B. Tadmor

原文链接:https://arxiv.org/abs/2210.08047

图2:本文的算法流程图

内容简介:密度泛函理论是一种基于量子力学的计算化学方法,它的计算结果较为准确,然而计算成本高昂。所以,以往很多研究人员致力于定义基于物理的具有解析表达式的经验力场,但是其精度有限。近年来,神经网络势成为了兼顾二者优势的桥梁,然而其训练过程往往需要大量DFT标记的样本。对此,本文的作者提出两个策略,通过利用经验力场里的物理信息,实现弱监督学习的神经网络势。第一个策略是,通过训练一个分类器去挑选未标记样本可能的最好经验力场,将该力场计算得到的能量值作为该未标记样本的标签值,实现数据增强。第二个策略则是基于迁移学习,先在一个大量通过经验力场获得的数据集中训练,再利用DFT标记的样本进行微调。实验显示,第一个策略可将性能提升5%-51%,第二个策略则可提升多达55%。

3.论文题目原文:Supervised Pretraining for Molecular Force Fields and Properties Prediction (NeurIPS 2022)

论文题目译文:带监督的分子场力预训练和属性预测(NeurIPS 2022)

论文作者:字节跳动Xiang Gao、 Weihao Gao、 Wenzhi Xiao、 Zhirui Wang、 Chong Wang、, Liang Xiang等

原文链接:https://arxiv.org/abs/2211.14429

图3:本文的工作流框架

内容简介:字节跳动的研究人员在一个具有8600万分子的数据集上对神经网络势进行了预训练。实验表明,相比从头训练,预训练网络微调的模型在7个分子预测性质任务和5个力场任务中性能都有大幅度提升。作者还提出一种线性探测的方式,通过逐层分析网络在预训练过程中学到的分子表示,证实了该策略可以有效预测包括原子类型,原子间距离,分子骨架类型在内的诸多分子性质。

4.论文题目原文:MACE: Higher Order Equivariant Message Passing Neural Networks for Fast and Accurate Force Fields (NeurIPS 2022)

论文题目译文:MACE:高阶等变消息传递神经网络的快速和准确场力(NeurIPS 2022)

论文作者:剑桥大学Ilyes Batatia、 Gregor N. C. Simm等

原文链接:https://openreview.net/forum?id=YPpSngE-ZU

内容简介:消息传递网络(MPNN)是一种图神经网络,它们将标记的图映射到向量空间,在分子力场领域,原子的标签称为态。这些态往往是半局域的(存在截止距离)。MPNN包括三个阶段,分别是消息传递阶段(聚合阶段)、更新阶段和读取阶段。现存的大多数MPNN力场都是基于两个原子相互作用即二体信息的,这意味着他们只依赖于两个原子的态,即二体相互作用。这明显于实际情况不符,然而多体作用往往会带来计算成本的提升。本文作者提出了一种策略,可以在仅用两次消息传递实现四体相互作用,同时兼顾了准确性和高效性。这一点在rMD17,3BPA以及AcAc等benchmark数据集任务中得到证实。

结论:以上四篇论文来自欧美顶尖学院(如美国的麻省理工和英国的剑桥大学)或公司(字节跳动),代表了人工智能在分子动力学领域的最新进展和研究方向,供在这一领域有深耕意向的读者参考。

编辑:王菁

校对:王欣

数据派研究部介绍

数据派研究部成立于2017年初,以兴趣为核心划分多个组别,各组既遵循研究部整体的知识分享实践项目规划,又各具特色:

算法模型组:积极组队参加kaggle等比赛,原创手把手教系列文章;

调研分析组:通过专访等方式调研大数据的应用,探索数据产品之美;

系统平台组:追踪大数据&人工智能系统平台技术前沿,对话专家;

自然语言处理组:重于实践,积极参加比赛及策划各类文本分析项目;

制造业大数据组:秉工业强国之梦,产学研政结合,挖掘数据价值;

数据可视化组:将信息与艺术融合,探索数据之美,学用可视化讲故事;

网络爬虫组:爬取网络信息,配合其他各组开发创意项目。

点击文末“阅读原文”,报名数据派研究部志愿者,总有一组适合你~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派THUID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

未经许可的转载以及改编者,我们将依法追究其法律责任。

点击“阅读原文”加入组织~

原创 | 机器学习在分子动力学领域顶会论文初探相关推荐

  1. 最新自然语言处理领域顶会论文大合集!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! [导读]本资源整理了近几年,自然语言处理领域各大AI相关的顶会中,一些经典.最新. ...

  2. 北大本科生凭芯片研究获全球竞赛第一!一作发表8篇EDA领域顶会论文,“致力探索卡脖子难题”

    北大本科生,刚刚凭借在芯片领域的贡献,斩获国际计算机学会(ACM)年度学生科研竞赛总决赛第一名(本科生组)! 还收获了来自<人民日报>的点赞. 这位少年名叫郭资政,是北京大学图灵班大四学生 ...

  3. 干货 | 这样做轻松复现顶会论文

    在科研界,快速刷论文了解一下最前沿研究已经是每个科研er的必备技能了. 尤其是个各大顶会论文,作为当下Al发展的风向标.每一次论文出来,本着不想被别人卷死,就只能去卷别人了的原则,顶会论文大家都希望能 ...

  4. 机器学习、深度学习、自然语言处理、计算机视觉顶级期刊的论文资料分享(附顶会论文下载链接)...

    推荐一个Github项目,项目整理了机器学习.深度学习.自然语言处理.计算机视觉等领域的顶会论文全集.超级赞!!! Github项目地址:https://github.com/murufeng/awe ...

  5. 史上最全!计算机科学领域顶会最佳论文大合集:微软研究院最多,清华排24...

    ↑ 点击上方[计算机视觉联盟]关注我们 最近,计算机科学领域的一份硬核资源更新了,收罗了自1996年以来这一领域的顶级学术会议最佳论文,堪称史上最全. 整理这份资源的,是布朗大学计算机科学助理教授Je ...

  6. ​原创 | AI顶会论文很多附带源代码?不少是假开源!

    作者:林嘉亮审校:陈之炎本文约3500字,建议阅读10分钟相当多的作者没有向用户提供足够详细的文档,导致了一些重要信息的缺失. 看到一篇绝佳的AI论文,非常期待作者能提供源代码,全文搜索HTTP,可惜 ...

  7. 多媒体领域顶会--ACM MM 2020 会议论文打包下载

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 ACM International Conference on Multimedia (ACM ...

  8. 用外观判断论文好坏?这位顶会领域主席的论文被自己的AI审稿系统拒绝了

    机器之心报道 机器之心编辑部 今日,arXiv 上刚发布的一篇论文引起了极大的关注.该研究基于论文的视觉外观训练了一个分类器来预测一篇论文应该被接收或者拒绝.该论文作者为弗吉尼亚理工学院助理教授 Ji ...

  9. 计算未来轻沙龙 | 顶会论文相继放榜,NLP领域有哪些最新进展?

    金秋十月,硕果盈累 最近NeurIPS.EMNLP等顶会相继放榜 在一番精心筹备之下 PaperWeekly再度携手清华大学计算机系 为大家献上一期自然语言处理前沿研讨会! 本期线下沙龙不仅有 新鲜出 ...

最新文章

  1. 【JSConf EU 2018】Ryan Dahl: Node.js 的设计错误
  2. AngularJs学习
  3. 闭锁CountDownLatch和栅栏CyclicBarrier之异同举例
  4. 【数据挖掘知识点三】大数定理与中心极限定理
  5. MySQL字符串截取函数
  6. wget命令出现Unable to establish SSL connection.错误
  7. 中小型研发团队架构实践三要点--转
  8. 用Hadoop1.0.3实现KMeans算法
  9. underscore.js _.map[Collections]
  10. 2.6.24及以上版本内核裁剪后启动黑屏的解决办法
  11. H3C 帧中继初级配置(二)
  12. 四剑客查找字符_linux 四剑客 find 、grep、sed、awk整理
  13. ANTLR实现的SQL解析器 - OQL
  14. 小米球(Ngrok)实现内网穿透,让外网可以进行访问本地部署的 API
  15. CTF训练(密码学)——位移密码
  16. Python 实验三 使用 TCP 实现智能聊天机器人
  17. 如何看待IT行业发展前景,就业前景和人才需求趋势
  18. Java学习day08--方法引用和Stream流
  19. 苹果手机升级13无法开机_苹果手机更新时突然断电,手机无法开机,为什么?...
  20. ZEMAX | ZOS-API、ZPL 和 DLL 之间的区别

热门文章

  1. 通俗易懂的5种IO模型文章
  2. 自定义Camera系列之:GLSurfaceView + Camera2
  3. 有什么建站软件可以快速建网站?
  4. 【NCL】ENSO冷暖事件海温异常合成与t检验
  5. COCO 数据集的使用,以及下载链接
  6. 图与网络模型:经典问题、基本概念、表示方法、连通图
  7. js 中文转成拼音字母 并A-Z排序 索引功能
  8. C语言编写班级花名册(顺序表版)
  9. Codeforces Round #723 (Div. 2)补题
  10. java打桩_C代码的打桩框架 - FFF (Fake Function Framework)