从RDKit的基本用法中看到了化学信息学中使用的各种概念。大多数情况下,流程中处理的化合物数据存储在列表或字典类型变量中,该变量是python或numpy数组的基本数据类型。

另一方面,在使用python进行数据科学和探索性数据分析中,主流是使用pandas Series和DataFrame数据类型。这次,将通过学习如何使用pandas DataFrames处理RDKit Mol对象来填补这一空白。

Pandas

pandas是一个用于处理数据的python库,它是在python数据科学中心提供数据类型以及随之而来的各种操作的库。它特别擅长处理数字数据和时间序列数据中的异常值和缺失值。虽然numpy只能处理统一数值数据的数组,但pandas具有可以处理不均匀数据的功能。

数据结构

  • Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、boole

RDKit | 基于RDKit的PandasTools加速数据分析相关推荐

  1. RDKit | 基于RDKit和Cytoscape绘制分子相似图

    化学信息学中有许多网络结构化数据.例如分子,分子相似图和MMP等. Cytoscape是一款图形化显示网络并进行分析和编辑的软件 基于RDKit和Cytoscape绘制分子的相似图. py2cytos ...

  2. RDKit | 基于RDKit(≥2020.09.1)的相似图绘制新方法

    导入库 from rdkit import Chem from rdkit.Chem import Draw from rdkit.Chem.Draw import SimilarityMaps fr ...

  3. RDKit | 基于RDKit绘制黑白颜色的分子

    基于RDKit绘制黑白颜色的分子 导入库 from rdkit import Chem from rdkit.Chem import Draw from rdkit.Chem.Draw import ...

  4. RDKit | 基于RDKit绘制带原子和键的索引、注释和立体化学

    基于RDKit绘制带原子和键的索引.注释和立体化学 导入库 from rdkit import Chem from rdkit.Chem import Draw from rdkit.Chem.Dra ...

  5. RDKit | 基于RDKit的指定原子或键高亮

    基于RDKit的指定原子或键高亮 指定原子或键高亮 HilightChemAtom.py from rdkit import Chem from rdkit.Chem.Draw import rdMo ...

  6. RDKit | 基于RDKit的SMILES转canonical SMILES

    基于RDKit的SMILES String转canonical SMILES String 导入库 from rdkit import Chem from rdkit.Chem import Draw ...

  7. RDKit | 基于RDKit和k-均值对化合物进行非分层聚类

    具有高相似性的分子组合可以改写为在化合物空间(化学空间)中具有短距离.在这种情况下,"相似性"和"距离"可互换使用.通过选择相距较远的化合物,可以构建各种化合物 ...

  8. RDKit | 基于RDKit绘制化学反应

    基于RDKit绘制化学反应 导入库 from rdkit import RDConfig import unittest import random from rdkit import Chem fr ...

  9. RDKit | 基于RDKit可视化脂溶性在溶解度贡献中的应用

    尝试了logP,仅使用原子的权重即可可视化. 导入库 import base64 from io import BytesIO import warnings warnings.filterwarni ...

最新文章

  1. vue:虚拟dom的实现
  2. 史上第二走心的 iOS11 Drag Drop 教程
  3. Linux简介、什么是Linux
  4. [MySQL] MySQL的自己主动化安装部署
  5. 超级计算机为什么快,演讲视频_为什么这台超级计算机如此快? (有声) _沪江英语...
  6. Intel Realsense 使用D435时需安装的几款官方软件
  7. 字符串匹配算法KMP算法
  8. eclipse查看git地址_使用Git进行版本控制
  9. hashmap为什么用红黑树_要看HashMap源码,先来看看它的设计思想
  10. pymysql使用变化的变量,构造SQL语句
  11. [Unity脚本运行时更新]C#7.3新特性
  12. python爬虫10万信息mysql_python爬虫:爬取易迅网价格信息,并写入Mysql数据库
  13. html div画圆有什么用,圆形div栏,用于评级html5 js(Circle div bar for rating html5 js)
  14. 211学校计算机报考人数信息,速查!这些985 211学校已发布考研调剂信息
  15. 如何在Visual Studio 2012中撤消“范围到此”?
  16. Axure总结和感想
  17. 《程序开发心理学——银年纪念版》前言
  18. 计算机网络中什么是突发错,计算机网络基础习题(含答案)
  19. ens2sym <- select(org.Hs.eg.db, keys=row.names(pc9_removebatch_b12),columns=c(“ENTREZID“,“SYMBOL“),
  20. 数学三次危机(二)毕达哥拉斯学派的数学思想

热门文章

  1. 手动配置linux(centos)的IP地址
  2. Office 2007中的简繁体转换功能
  3. 极客新闻——11、程序员需要避免的10个坏习惯
  4. leangoo敏捷工具卡片关联上线
  5. 程序员天花板:产后半年加薪升职,这位程序员妈妈绝了!
  6. OAuth 2 实现单点登录,通俗易懂!
  7. 【高并发】ReadWriteLock怎么和缓存扯上关系了?!
  8. 求求你不要在用!=null判空了
  9. 程序员都应该知道的JVM参数
  10. 程序员一定要投资的十件事