RDKit | 基于RDKit的PandasTools加速数据分析
从RDKit的基本用法中看到了化学信息学中使用的各种概念。大多数情况下,流程中处理的化合物数据存储在列表或字典类型变量中,该变量是python或numpy数组的基本数据类型。
另一方面,在使用python进行数据科学和探索性数据分析中,主流是使用pandas Series和DataFrame数据类型。这次,将通过学习如何使用pandas DataFrames处理RDKit Mol对象来填补这一空白。
Pandas
pandas是一个用于处理数据的python库,它是在python数据科学中心提供数据类型以及随之而来的各种操作的库。它特别擅长处理数字数据和时间序列数据中的异常值和缺失值。虽然numpy只能处理统一数值数据的数组,但pandas具有可以处理不均匀数据的功能。
数据结构
- Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、boole
RDKit | 基于RDKit的PandasTools加速数据分析相关推荐
- RDKit | 基于RDKit和Cytoscape绘制分子相似图
化学信息学中有许多网络结构化数据.例如分子,分子相似图和MMP等. Cytoscape是一款图形化显示网络并进行分析和编辑的软件 基于RDKit和Cytoscape绘制分子的相似图. py2cytos ...
- RDKit | 基于RDKit(≥2020.09.1)的相似图绘制新方法
导入库 from rdkit import Chem from rdkit.Chem import Draw from rdkit.Chem.Draw import SimilarityMaps fr ...
- RDKit | 基于RDKit绘制黑白颜色的分子
基于RDKit绘制黑白颜色的分子 导入库 from rdkit import Chem from rdkit.Chem import Draw from rdkit.Chem.Draw import ...
- RDKit | 基于RDKit绘制带原子和键的索引、注释和立体化学
基于RDKit绘制带原子和键的索引.注释和立体化学 导入库 from rdkit import Chem from rdkit.Chem import Draw from rdkit.Chem.Dra ...
- RDKit | 基于RDKit的指定原子或键高亮
基于RDKit的指定原子或键高亮 指定原子或键高亮 HilightChemAtom.py from rdkit import Chem from rdkit.Chem.Draw import rdMo ...
- RDKit | 基于RDKit的SMILES转canonical SMILES
基于RDKit的SMILES String转canonical SMILES String 导入库 from rdkit import Chem from rdkit.Chem import Draw ...
- RDKit | 基于RDKit和k-均值对化合物进行非分层聚类
具有高相似性的分子组合可以改写为在化合物空间(化学空间)中具有短距离.在这种情况下,"相似性"和"距离"可互换使用.通过选择相距较远的化合物,可以构建各种化合物 ...
- RDKit | 基于RDKit绘制化学反应
基于RDKit绘制化学反应 导入库 from rdkit import RDConfig import unittest import random from rdkit import Chem fr ...
- RDKit | 基于RDKit可视化脂溶性在溶解度贡献中的应用
尝试了logP,仅使用原子的权重即可可视化. 导入库 import base64 from io import BytesIO import warnings warnings.filterwarni ...
最新文章
- vue:虚拟dom的实现
- 史上第二走心的 iOS11 Drag Drop 教程
- Linux简介、什么是Linux
- [MySQL] MySQL的自己主动化安装部署
- 超级计算机为什么快,演讲视频_为什么这台超级计算机如此快? (有声) _沪江英语...
- Intel Realsense 使用D435时需安装的几款官方软件
- 字符串匹配算法KMP算法
- eclipse查看git地址_使用Git进行版本控制
- hashmap为什么用红黑树_要看HashMap源码,先来看看它的设计思想
- pymysql使用变化的变量,构造SQL语句
- [Unity脚本运行时更新]C#7.3新特性
- python爬虫10万信息mysql_python爬虫:爬取易迅网价格信息,并写入Mysql数据库
- html div画圆有什么用,圆形div栏,用于评级html5 js(Circle div bar for rating html5 js)
- 211学校计算机报考人数信息,速查!这些985 211学校已发布考研调剂信息
- 如何在Visual Studio 2012中撤消“范围到此”?
- Axure总结和感想
- 《程序开发心理学——银年纪念版》前言
- 计算机网络中什么是突发错,计算机网络基础习题(含答案)
- ens2sym <- select(org.Hs.eg.db, keys=row.names(pc9_removebatch_b12),columns=c(“ENTREZID“,“SYMBOL“),
- 数学三次危机(二)毕达哥拉斯学派的数学思想