将化合物格式SDF文件转换为CSV文件。

  • 读取SDF中的属性并输出为CSV项目
  • 不必使每个化合物的属性具有相同的属性(输出不为空的属性)。

import pandas as pd
from rdkit import Chem
import argparse
from collections import defaultdictdef main():parser = argparse.ArgumentParser()parser.add_argument("-input", type=str, required=True)parser.add_argument("-output", type=str, required=True)parser.add_argument("-save_name", action='store_true', help="store header line as _Name")args = parser.parse_args()# Read SDFsdf_sup = Chem.SDMolSupplier(args.input)Props = []if args.save_name:Props.append("_Name")for mol in sdf_sup:for name in mol.GetPropNames():if name not in Props:Props.append(name)# dictionary for storing dataparam_dict = defaultdict(list)# Read 

RDKit | 化合物SDF文件转换为SMILES存储为CSV相关推荐

  1. csv转为utf8编码_将utf-8编码的csv文件转换为gb2312编码的csv文件

    csv文件编码转换:解决utf-8编码的文件在excel打开时中文乱码问题. Python完整代码如下: # -*- coding:utf-8 -*- # date = 20201231 #将utf- ...

  2. 【ROS-Gazebo】将sdf文件转为urdf的方法

    这几天在重新琢磨Gazebo,由于我是机械专业出身,对Solidworks之类的可视化建模总有一种执着的追求.但现在大多数教程中的urdf建模方法真的十分鬼!于是我按照Gazebo官网教程的方法建立了 ...

  3. Pandas之文件读取与存储

    文件读取与存储 1 CSV 1.1 read_csv 1.2 to_csv 1.3案例 2 HDF5 2.1 read_hdf与to_hdf 2.2案例 3 JSON 3.1 read_json 3. ...

  4. 总文件夹下含有多个sdf,批量转换为SMILES并保存到csv中

    本代码适用于这种结构的文件,主要还是SDMolSupplier的参数要转化为str类型,并且只能一个一个的转化. import sys import torch import os from rdki ...

  5. 基于RDKit的Python脚本:SDF格式转SMILES格式

    RDKit: Open-Source Cheminformatics Software http://www.rdkit.org/ 简化分子线性输入规范(SMILES)是一种用ASCII字符串明确描述 ...

  6. 使用 Pubchempy 一行命令从 Pubchem 数据库中批量下载化合物 3D 构象的 sdf 文件

    要求 安装了pubchempy包. conda方法安装pubchempy(v 1.0.4) 正文 下载化合物 cid:529 的3D构象的sdf文件. import pubchempy as pcp ...

  7. 【python学习】批量读取Materials Studio的sdf文件,从文件中提取特定信息并按列存储在CSV文件

    批量读取Materials Studio的sdf文件,从文件中提取特定信息并按列存储在CSV文件 Materials Studio在执行dmol3模块中结构优化任务时,任务结束后会产生一系列的输出文件 ...

  8. 使用python批量下载需要的分子的SDF文件

    使用python批量下载需要的分子的SDF文件 这里需要借助python的第三方库pubchempy (可以使用pip安装:pip install pubchempy) 首先定义文件的路径(这里的文件 ...

  9. 将Excel文件转换为Html

    将Excel文件转换为HTML 背景 我的工作有时会涉及到财务数据的处理.我们大家都知道,Excel文件在处理数据中很流行并且被广泛使用.Excel让我们可以将存储在里面的数据进行数学计算.我在工作中 ...

最新文章

  1. 独家|OpenCV1.9 如何利用OpenCV的parallel_for_并行化代码(附代码)
  2. animiz动画制作软件_学习动画制作需要掌握的常用软件合集
  3. Android中使用Room时怎样存储带list集合的对象
  4. python不同目录调用_python3 不同目录间模块调用
  5. java owl文件_jena解析.owl文件 实现owl文件的解析 - 下载 - 搜珍网
  6. MySQL数据库的权限管理
  7. 关于heapsize heapgrowthlimit
  8. iOS底层探索之Block(一)——初识Block(你知道几种Block呢?)
  9. 树莓派百度云下载工具bypy
  10. 蓝桥杯真题:平方和(2019 年省赛)
  11. 超星的Pdg/Pdz转带书签目录Pdf的好方法
  12. GSM模块通过服务器或GSM内部获取网络时间 网络授时
  13. python处理excel数据画曲线图_python读取excel数据绘制简单曲线图的完整步骤记录...
  14. 2016年实习生招聘信息
  15. js的变量命名需要遵循什么规则?
  16. “CreateProcess error=206, 文件名或扩展名太长” 错误解决办法
  17. Spring依赖注入的方式、类型、Bean的作用域、自动注入、在Spring配置文件中引入属性文件...
  18. 基于V2EX API的nodejs组件.
  19. 树莓派mqtt协议连接阿里云物联网平台,手机端获取数据并控制
  20. 数据集标注(在线标注,方便快捷)/YOLOV5自建数据集

热门文章

  1. 自动买卖炒股软件的设置条件?
  2. python剪贴板操作_python 操作剪切板
  3. 2012年03月31日
  4. ActiveSync 3.7
  5. [计算机模拟]经典报童问题
  6. Liunx服务器安装nginx(安装包版)
  7. AQS排它锁的获取acquire、释放release详解
  8. 泛微移动平台(E-Mobile)升级包升级操作说明
  9. 机房安全监控设备连接图及指令发送
  10. 阿里云对象存储OSS入门使用