https://www.pnas.org/doi/full/10.1073/pnas.1803294115

论文 node edges types
DeepDDI 2159(1710) 192284 86
MUFFIN 2323(1569) 172426 81
Me 1872 362208
MDF-SA-DDI 572/1258 74528/323539 65/100
DDIMDL 572/572 37264/74528  65
SumGNN 1709 192224 86

DeepDDI:2159个approved,包含smiles,但是我把DeepDDI里面那个192284个边关系的拿出来写代码数一下实际用到只有1710个,可能是本来99种关系,消除到86种的话,去掉了几百种?Bitbucket

MUFFIN:192284是86种关系每一种都超过了5个实例,MUFFIN种筛选出每一种都超过10个实例的。同样的,统计multi_ddi_sift.txt这个实体个数是1569,但是drugname_smiles.npy是2323个。变成了172426个关系。

Me:我从drugbank上下载了drugbank.xml v5.0.3版本,然后从里面抽出来aproved 且包含smiles的,个数是1872个作为实体集。然后抽取两个实体都在这个实体集中的DDI,结果居然是362208。我不理解

DDIMDL:论文中提到,从DrugBank中收集包含1.substructure,targets, pathway,enzymes的药物,使用KEGG数据库获得pathway,target和enzymes都是从drugbank直接获取,最后获得了57个药物,74528个药物对。但是在代码中是572实体,37264个药物对。。。我不理解。。。

MDF-SA-DDI:文中提到利用DDIMDL中的药物对572/74528个药物对作为小的数据集,第二个数据集是抽取了三个特征,子结构,靶点,酶(少了一个pathways)。


DrugBank模型数据集比较相关推荐

  1. 基于Python tensorflow2.3实现的水果识别系统源码+模型+数据集,卷积神经网络的入门案例

    水果识别-基于tensorflow2.3实现 水果识别是卷积神经网络的入门案例,这里我将模型的训练.测试.保存以及使用整合在了一起,至于原理部分,大家可以参考知乎或者B站上的回答,在这里我就不赘述了 ...

  2. T5模型数据集(C4)

    T5(Transfer Text-to-Text Transformer)模型:一个统一框架,靠着大力出奇迹,将所有 NLP 任务都转化成 Text-to-Text (文本到文本)任务. T5(Tex ...

  3. 【数据处理脚本】RA-CNN模型数据集处理及训练出现的报错解决

    文件合并处理的脚本编写 在我的虹膜数据集中,每个人的数据对应一个编号的文件夹(如001),文件夹下分左右眼文件夹(L和R),结构如下: 001 L R 002 L R 在本次实验中,没有对左右眼进行区 ...

  4. Python:分类模型数据集找不到怎么办?自己动手,丰衣足食!

    小伙伴们在用机器学习模型进行分类的时候,可能会遇到这样的问题:明明我都把模型建立起来了,代码也写好了,但是,数据集上哪儿找去? 巧妇难为无米之炊,今儿我就告诉大伙儿一个方法,来自己嗯造数据集 #导入s ...

  5. Google 谷歌 AI博客:发布Objectron 3D对象检测模型数据集

    仅通过在照片上训练模型,机器学习(ML)的最新技术就已经在许多计算机视觉任务中实现了卓越的准确性.基于这些成功和不断发展的3D对象理解,在增强现实,机器人技术,自主性和图像检索等广泛应用方面具有巨大潜 ...

  6. 【易盾图像识别】文字点选识别 附带 模型+数据集 +识别代码+思路

    如有损害他人利益,请即时通知,文章会在第一时间内删除! 前言 继极验文字点选的发布,怎么能少得了易盾呢,本次分享将会把模型,代码,数据集一起分享出来! 摘要(About this paper): 易盾 ...

  7. YOLOV8做实例分割(环境配置+搭建模型+数据集制作+训练+预测全套)

    目录 一.安装Anaconda3 1.下载 2.安装 3.验证 二.搭建windows上yolov8环境 1.cuda+pytorch+python版本选择 ①查看自己电脑的cuda型号 ②显卡驱动版 ...

  8. 数据集大小与模型性能的敏感性分析

    [翻译自 : sensitivity-analysis-of-dataset-size-vs-model-performance] [说明:Jason Brownlee PhD大神的文章个人很喜欢,所 ...

  9. paddle - crowdHuman数据集训练人体识别模型

    paddle - crowdHuman数据集训练人体识别模型 数据集annotation crowdhuman的odgt文件各项意义 转换为paddle yolo的格式 输入哪些数据? 输出模型 数据 ...

最新文章

  1. ovirt官方安装文档 附录F
  2. 疫情当下,你是在家里躺着刷抖音?还是在做这些?
  3. 关于String的matches方法
  4. 第二章 java常用开发工具以及程序的编写
  5. matlab中quat2angle,RPY_Euler_Quaternion_AngleAxis角度转化:Matlab、Python、Halc
  6. 十五、PHP框架Laravel学习笔记——构造器的 join 查询
  7. java中int,char,string三种类型的相互转换
  8. 机器学习ai选股_自带AI机器学习的MEMS了解一下
  9. Redmi Note10系列配LCD居中挖孔屏:5月26日正式发布
  10. Kuberentes-入门
  11. Android服务显式启动、隐式启动、绑定服务、本地客户端调用远程服务器音乐文件
  12. Slog86_使用Sketch 设计ArthurSlog网站主页原型
  13. python小人画爱心_用Python画一颗心、小人发射爱心(附源码)
  14. 【TSP】基于matlab遗传算法求解中国35省会城市旅行商问题【含Matlab源码 1222期】
  15. softmax 激活函数
  16. MATLAB中绘制椭圆
  17. 航程门业:如何选购实木复合门及如何保养
  18. DataX二次开发——(6)kafkareader、kafkawriter的开发
  19. 快速将PDF转换为图片:使用在线转换器的步骤
  20. 【AirPlay2开发】协议整合

热门文章

  1. 观沈向洋博士论文阅读技巧有感
  2. 【产品经理】需求调研--准备工作、目的分析、调研方式
  3. android 8小米note,荣耀8和小米note哪个好
  4. tcp拥塞算法分析五(vegas)
  5. Android 因moov播放网络mp4失败的解决办法
  6. setaspectratio函数_ProCAST介绍及菜单详解分解
  7. 【优秀毕设】基于OpenCV的人脸识别打卡/签到/考勤管理系统(最简基本库开发、可基于树莓派)
  8. 不同大小的宋体0~9印刷体数字识别分析结果
  9. [carla入门教程]-3 在carla中遥控汽车并采集传感器数据(一个简单Demo,附代码)
  10. VBA编程中的 sheet1 与 sheets(1)的区别