• 来自我的个人网站: http://wangbch.com

化学中的机器学习方法

  • 化学中的ML主要是用在能量预测上,MoleculeNet或DeepChem实现了较多的方法。通常有用分子结构式或用分子坐标进行能量预测两种。下面主要讲从分子坐标到能量

从分子坐标到能量

  • 分子坐标作为一个Nx3(N为原子数目)的矩阵,可以直接用神经网络等ML方法映射到一个能量浮点数上,但是这样不具备平移和旋转对称性,即平移之后,矩阵变动很大,但是实际上分子的能量没有变,要实现这种对称性,要么就数据集扩增(强行平移坐标,能量不变)要么就编码(实现一种平移对称性编码)。
  • ANI-1方法实现的编码是,将每一个原子作为中心原子,对于每一种其他元素的所有原子,求距离得到一个距离向量(比如第1个C原子,对所有氧原子求距离得到距离向量),然后将距离向量作为x代入一个固定均值和方差的高斯函数中,将新得到的向量进行reduce降维求和(reduce_sum就是将向量各元素相加得到1个浮点数),高斯函数有多个,均值和方差都不同。
  • 这样的编码效果是将Nx3的矩阵变成NxMxL的矩阵,N是原子数目,M是元素数目,L是高斯函数的数目(也可能是NxM*L,后两维flatten成向量)。这样采用高斯函数编码,对于任意多的原子,编码过后向量长度都是L(而不是随着原子数目增加)
  • 此外,另一个拓展新还体现在,对于不同的中心原子种类,作为不同的DenseNN的输入,最后得到一个能量分量,最终用reduce sum求和作为能量。
  • 比如CHO原子的输入3x3,经过5个高斯函数转化为3x3x5或3x15,然后按照CHO分成三个1x3x5,放入三个DenseNN中,这个DenseNN输入为3x5或者15,输出为1长度。这样的操作使得对于原子种类有扩展性,并且更为精确。

化学中的机器学习方法1相关推荐

  1. 水声被动定位中的机器学习方法研究进展综述

    水声被动定位中的机器学习方法研究进展综述 人工智能技术与咨询 来源:<信号处理>,作者牛海强等 摘 要: 本文对基于机器学习方法的水声被动定位研究进展进行了综述.所涉及的机器学习方法有多层 ...

  2. 国科大人工智能学院《计算机视觉》课 —计算机视觉中的机器学习方法

    一.背景内容 二.计算机视觉中的机器学习方法:子空间分析(PCA.ICA.LDA) PCA的应用: 三.计算机视觉中的机器学习方法:流行学习(LLE.Isomap.Laplacian Eigenmap ...

  3. 人工机器:人工智能中的机器学习方法

    人工智能的定义为基于表观的行为定义,即图灵测试,可以形式化为模式识别.智能从知识论的角度分析,归纳明确知识规则构建知识图谱系统形成专家系统,而通过数据获得归纳规则约束参数为机器学习系统,即基于数据的模 ...

  4. 脑电信号(EEG)处理中的机器学习方法总结——回归模型,SVM、K近邻、人工神经网络、朴素贝叶斯、决策树和随机森林、集成学习、模糊逻辑、LDA线性判别分析、K-means聚类、强化学习、迁移学习

    本文归纳总结了机器学习在脑电分析中的应用,并详细介绍回归模型,SVM.K近邻.人工神经网络.朴素贝叶斯.决策树和随机森林.集成学习.模糊逻辑.LDA线性判别分析.K-means聚类.强化学习.迁移学习 ...

  5. 提取地图中道路_非机器学习方法·从遥感影像中提取道路

    本科低年级曾经做过一个提取道路线的题目. 提供的数据:老师给我们了一幅学校周边地区的影像,包括RGB+Infrared四个波段. 一开始使用的方法:当时尚青涩的我和小伙伴们一起使用KMEANS.阈值分 ...

  6. Nat. Commun. | 识别药物靶点的贝叶斯机器学习方法

    今天给大家介绍的是2019年11月发表在Nature Communications的一篇文章,"A Bayesian machine learning approach for drug t ...

  7. Mol2vec | 一种无监督机器学习方法的分子亚结构向量表示

    Mol2vec 受自然语言处理技术的启发,这里介绍Mol2vec是一种无监督的机器学习方法,用于学习分子亚结构的向量表示.就像Word2vec模型一样,密切相关的单词的向量在向量空间中非常接近,Mol ...

  8. 论文阅读:(2020版)A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法

    A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法 目录 A Survey on Deep Learning f ...

  9. 【综述】分子表示与性质预测中的深度学习方法

    Deep learning methods for molecular representation and property prediction 目录 总结 一.Introduction 二.Se ...

最新文章

  1. 最好用浏览器_魔镜魔镜,请你告诉我谁是Mac上最好用的浏览器?--全网最好用的12个功能让你玩转Safari...
  2. 浅析网站建设必要的专用软件
  3. 浅析Web2.0技术
  4. A Fully Featured Windows HTTP Wrapper in C++
  5. 【干货】写给产品经理和设计师的用户体验知识
  6. HADOOP集群中节点之间的配置文件可否不一样?
  7. git常用命令与常见错误
  8. 压缩下载到浏览器的工具类
  9. Python(51)_从100打印到0
  10. 卡特兰数(JAVA大数)Buy the Ticket
  11. C语言开定时器做呼吸灯程序,单片机制作呼吸灯的C语言程序怎么样编写
  12. dw向右滚动字幕HTML,DW滚动文字代码肿么添加?
  13. 无线路由器打印机服务器设置,路由器 打印机服务器设置方法
  14. php 求幂数,C 笔记九 求幂函数
  15. 训练好的神经网络 如何预测_【家长必看】如何帮助孩子训练好口才?
  16. 基于tesseract的文字识别
  17. 微信公众号回复小程序链接
  18. 测试报告(包括测试总结)
  19. 如何评价 2021 考研政治题,难度如何?
  20. 顺丰同城赴港IPO,即时配送烽火再起

热门文章

  1. config.nt的问题
  2. Gstreamer学习笔记(4):pad定义、连接、流动
  3. 【PCL自学:Filtering】PCL中的各类滤波器介绍与使用 (持续更新)
  4. 一些计算机视觉企业方面的网站
  5. SSM框架下实现验证码图片验证功能(源码)
  6. 数据库、数据库管理系统和数据库系统简述
  7. java生成dat文件怎么打开_可以使用哪个软件工具打开Java程序生成的dat数据文件?...
  8. 关于开放自动化的思考:模型,协议与算法
  9. Java某机构笔记分享
  10. 服务器 信号超出范围,显示器上显示输入信号超出范围怎么处理