基于随机森林算法的化合物二分类机器学习模型


代码示例

#导入依赖包
import pandas as pd
import numpy as np
from rdkit import Chem, DataStructs
from rdkit.Chem import AllChem
from rdkit.ML.Descriptors import MoleculeDescriptors
from rdkit.Chem import Descriptors
from rdkit.Chem.EState import Fingerprinter
from rdkit.Chem import PandasTools
from sklearn.ensemble import RandomForestClassifier
from sklearn.utils import shuffle
from sklearn import metrics
from sklearn import model_selection
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt
#定义化合物指纹计算函数
def get_fps(mol):   # 计算指纹 (clogP, PSA, etc etc)   calc=MoleculeDescriptors.MolecularDescriptorCalculator([x[0] for x in Descriptors._descList])   ds = np.asarray(calc.CalcDescriptors(mol))   arr=Fingerprinter.FingerprintMol(mol)[0]   return np.append(arr,ds)

RDKit | 基于随机森林的化合物活性二分类模型相关推荐

  1. RDKit | 基于随机森林(RF)的机器学习模型预测hERG阻断剂活性

    从分子相似性评估到使用机器学习技术的定量构效关系分析各种建模方法已应用于不同大小和组成的数据集(阻断剂和非阻滞剂的数量).本研究中使用从公共生物活性数据开发用于预测hERG阻断剂的稳健分类器.随机森林 ...

  2. 大数据分析案例-基于随机森林算法构建新闻文本分类模型

  3. RDKit | 基于支持向量机(SVM)的二分类活性预测模型

    基于结构-活性相互作用数据,使用SVM(支持向量机),尝试判断测试化合物的活性. SVM SVM:(Support Vector Machine, 支持向量机)是一种二分类模型,它的基本模型是定义在特 ...

  4. 基于随机森林算法的人脸数据集分类

    目录 1. 作者介绍 2. 关于理论方面的知识介绍 随机森林 3. 实验过程 3.1 数据集介绍 3.2 实验代码 3.3 运行结果 3.3 实验总结 参考 1. 作者介绍 李佳敏,女,西安工程大学电 ...

  5. RDKit | 基于随机森林(RF)预测SARS-CoV 3CL蛋白酶抑制剂的pIC50

    导入库 import sklearn from rdkit.Chem import AllChem from rdkit import Chem from rdkit.Chem import Desc ...

  6. 全国大学生数据统计与分析竞赛2021年【本科组】-B题:战胜市场: 应用基于熵权平衡的 CatBoost 二分类模型和改进 RFM 用户价值模型

    目录 摘要 1 引言 1.1 问题描述 1.2 我们的思考 1.3 本文主要工作与创新点 2 模型假设

  7. 基于随机森林算法的多因子选股方法分析与实现(2,代码实现)

    摘要 量化投资中经常听到的"多因子模型"是个什么鬼?因子是影响因素的简称,或简单理解成指标.我们都知道股票收益受到多重因素的影响,比如宏观.行业.流动性.公司基本面.交易情绪等等. ...

  8. ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林实现模型可解释性案例

    ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林实现模型可解释性案例 目录 基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对R ...

  9. kaggle项目:基于随机森林模型的心脏病患者预测分类!

    公众号:尤而小屋 作者:Peter 编辑:Peter 大家好,我是Peter~ 新年的第一个项目实践~给大家分享一个新的kaggle案例:基于随机森林模型(RandomForest)的心脏病人预测分类 ...

最新文章

  1. 5m 云服务器2核4g_小鸟云的云服务器,2核4g,带宽5M,大概可支持多少人同时在线?...
  2. AOP的两种实现方式
  3. 动态规划--目标和问题
  4. 数据库服务器(SQL SERVER)的安全设置
  5. SAP透明工厂和弹性制造的原型mockup - SAP 工业 4.0 的一个尝试
  6. 信息学奥赛一本通(2026:【例4.12】阶乘和)
  7. 集群的可扩展性及其分布式体系结构(2)-上
  8. C盘空间越来越小怎么办,教你27招
  9. 三维计算机视觉(六)--3DSC(3D形状上下文特征)
  10. SpringCloud的Hystrix(二) 某消费者应用(如:ui、网关)访问的多个微服务的断路监控...
  11. TextBox设置ReadOnly属性后后台得不到值解决方法 [转]
  12. 进程间通信-----管道
  13. 宗地图绘制要求和规范_宗地图绘制的基本要求与内容.ppt
  14. 虚拟现实的伦理问题----陈教授讲座听后感
  15. Foxmail邮箱提示错误:ssl连接错误,errorCode:5解决方法
  16. 一文彻底解决An error occurred while creating the AVD. See idea.log for details问题
  17. matlab 函数pdf怎么用_PDF文档怎么进行批量旋转?调整页面用迅捷PDF转换器
  18. MongoDB LBS经纬度查询操作
  19. 适用于Android手机的汉信码识别SDK
  20. 记一次流量分析实战——安恒科技(八月ctf)

热门文章

  1. 美国字节程序员吐槽:国内同事太卷了!工资买不起房,卷的意义是什么?
  2. 并发编程中的大坑:你的直觉有序性问题
  3. 亿级京东应用架构设计与治理
  4. 某程序员吐槽清华北大不值钱了!过去清北毕业生去企业上班就是丢人现眼!现在互联网基层员工一堆清北人!清北怎么混成这样了?...
  5. 一文读懂大数据漏斗分析!
  6. 5分钟让你懂得什么是容器技术?
  7. fastjson获取json方法
  8. python 读取csv文件生成散点图
  9. java二维数组从键盘更改_互换二维数组的行列。要求数组的行数、列数以及各元素均从键盘输入;输出互换前数组内容和互换后数组内容。(要求循环输入进行测试)Java...
  10. java reference_java中的4种reference的差别和使用场景(含理论、代码和执行结果)...