RDKit | 化合物SDF文件转换为SMILES存储为CSV
将化合物格式SDF文件转换为CSV文件。
- 读取SDF中的属性并输出为CSV项目
- 不必使每个化合物的属性具有相同的属性(输出不为空的属性)。
import pandas as pd
from rdkit import Chem
import argparse
from collections import defaultdictdef main():parser = argparse.ArgumentParser()parser.add_argument("-input", type=str, required=True)parser.add_argument("-output", type=str, required=True)parser.add_argument("-save_name", action='store_true', help="store header line as _Name")args = parser.parse_args()# Read SDFsdf_sup = Chem.SDMolSupplier(args.input)Props = []if args.save_name:Props.append("_Name")for mol in sdf_sup:for name in mol.GetPropNames():if name not in Props:Props.append(name)# dictionary for storing dataparam_dict = defaultdict(list)# Read
RDKit | 化合物SDF文件转换为SMILES存储为CSV相关推荐
- csv转为utf8编码_将utf-8编码的csv文件转换为gb2312编码的csv文件
csv文件编码转换:解决utf-8编码的文件在excel打开时中文乱码问题. Python完整代码如下: # -*- coding:utf-8 -*- # date = 20201231 #将utf- ...
- 【ROS-Gazebo】将sdf文件转为urdf的方法
这几天在重新琢磨Gazebo,由于我是机械专业出身,对Solidworks之类的可视化建模总有一种执着的追求.但现在大多数教程中的urdf建模方法真的十分鬼!于是我按照Gazebo官网教程的方法建立了 ...
- Pandas之文件读取与存储
文件读取与存储 1 CSV 1.1 read_csv 1.2 to_csv 1.3案例 2 HDF5 2.1 read_hdf与to_hdf 2.2案例 3 JSON 3.1 read_json 3. ...
- 总文件夹下含有多个sdf,批量转换为SMILES并保存到csv中
本代码适用于这种结构的文件,主要还是SDMolSupplier的参数要转化为str类型,并且只能一个一个的转化. import sys import torch import os from rdki ...
- 基于RDKit的Python脚本:SDF格式转SMILES格式
RDKit: Open-Source Cheminformatics Software http://www.rdkit.org/ 简化分子线性输入规范(SMILES)是一种用ASCII字符串明确描述 ...
- 使用 Pubchempy 一行命令从 Pubchem 数据库中批量下载化合物 3D 构象的 sdf 文件
要求 安装了pubchempy包. conda方法安装pubchempy(v 1.0.4) 正文 下载化合物 cid:529 的3D构象的sdf文件. import pubchempy as pcp ...
- 【python学习】批量读取Materials Studio的sdf文件,从文件中提取特定信息并按列存储在CSV文件
批量读取Materials Studio的sdf文件,从文件中提取特定信息并按列存储在CSV文件 Materials Studio在执行dmol3模块中结构优化任务时,任务结束后会产生一系列的输出文件 ...
- 使用python批量下载需要的分子的SDF文件
使用python批量下载需要的分子的SDF文件 这里需要借助python的第三方库pubchempy (可以使用pip安装:pip install pubchempy) 首先定义文件的路径(这里的文件 ...
- 将Excel文件转换为Html
将Excel文件转换为HTML 背景 我的工作有时会涉及到财务数据的处理.我们大家都知道,Excel文件在处理数据中很流行并且被广泛使用.Excel让我们可以将存储在里面的数据进行数学计算.我在工作中 ...
最新文章
- 独家|OpenCV1.9 如何利用OpenCV的parallel_for_并行化代码(附代码)
- animiz动画制作软件_学习动画制作需要掌握的常用软件合集
- Android中使用Room时怎样存储带list集合的对象
- python不同目录调用_python3 不同目录间模块调用
- java owl文件_jena解析.owl文件 实现owl文件的解析 - 下载 - 搜珍网
- MySQL数据库的权限管理
- 关于heapsize heapgrowthlimit
- iOS底层探索之Block(一)——初识Block(你知道几种Block呢?)
- 树莓派百度云下载工具bypy
- 蓝桥杯真题:平方和(2019 年省赛)
- 超星的Pdg/Pdz转带书签目录Pdf的好方法
- GSM模块通过服务器或GSM内部获取网络时间 网络授时
- python处理excel数据画曲线图_python读取excel数据绘制简单曲线图的完整步骤记录...
- 2016年实习生招聘信息
- js的变量命名需要遵循什么规则?
- “CreateProcess error=206, 文件名或扩展名太长” 错误解决办法
- Spring依赖注入的方式、类型、Bean的作用域、自动注入、在Spring配置文件中引入属性文件...
- 基于V2EX API的nodejs组件.
- 树莓派mqtt协议连接阿里云物联网平台,手机端获取数据并控制
- 数据集标注(在线标注,方便快捷)/YOLOV5自建数据集