python 读取excel文件,并读成数据框格式输出
pandas直接读取
import pandas as pd
df = pd.read_excel('/path/file.xlsx' )
sheet_name: str, int, list, or None, default 0
header: Row (0-indexed) to use for the column labels of the parsed DataFrame.
names: List of column names to use.
usecols
官方文档
自定义函数(很久以前,都是用这个读取的,时代变迁太快啦)
from openpyxl import load_workbook
import pandas as pddef extract_xlsx_onesheet(wb, sheet_name, header=False):ws = wb[sheet_name]if header:data = ws.valuescolumns = next(data)[0:]df = pd.DataFrame(data, columns=columns)else:df = pd.DataFrame(ws.values)return df
读取excel文件:
path = 'C:/Users/DELL/Desktop/work/CloudStation/scaffold/CMGC_group.xlsx'
wb = oad_workbook(path)
查看有哪些sheet:
In [12]: wb.sheetnames
Out[12]: ['CDK', 'CDKL', 'CK2', 'CLK', 'DYRK', 'GSK', 'MAPK', 'RCK', 'SRPK']
选择一个读取成数据框:
df = extract_xlsx_onesheet(wb, 'CLK', header=True)
有列名就header=True, 否则不填即可。
In [12]: df
Out[14]: chembl_id_mol canonical_smiles
0 CHEMBL485053 CN1C(=N\C(=C/c2ccc3OCOc3c2)\C1=O)N
1 CHEMBL1803085 Oc1ccc(NC2=N\C(=C/c3ccc4OCOc4c3)\C(=O)N2)cc1
2 CHEMBL3728359 Nc1ccc(Cl)c(NC2=NC(=O)\C(=C\c3ccc4ncccc4c3)\S2)c1
3 CHEMBL2321962 O\N=C/1\C(=C/2\C(=O)Nc3c(Br)cccc23)\Nc4cc(ccc1...
4 CHEMBL2321952 O\N=C/1\C(=C/2\C(=O)Nc3ccccc23)\Nc4ccc(cc14)C(...
.. ... ...
101 CHEMBL1802856 CN1C(=N\C(=C/c2ccc3OCOc3c2)\C1=O)NC(=O)C
102 CHEMBL3318024 CCNC(=O)Nc1ccc2ncc(cc2n1)c3ccc(OC)c(OC)c3
103 CHEMBL2012570 Cc1nccc2c3cc4OCOc4cc3n(CCCCN)c12
104 CHEMBL2062565 CC(=O)Nc1cnc2ccn(c3cc(NC4CC4)n5ncc(C#N)c5n3)c2c1
105 CHEMBL1230165 OC(=O)c1ccc2c(c1)nc(Nc3cccc(Cl)c3)c4ccncc24
python 读取excel文件,并读成数据框格式输出相关推荐
- python读取excel文件并保存成array
要使用xlrd包. import numpy as np import xlrd #读取excel的库 resArray=[] #先声明一个空list data = xlrd.open_workboo ...
- python 读取excel文件 效率 时间 格式_python读取Excel文件中的时间数据
在使用python读取Excel文件中的时间格式,碰到的时间格式转换问题: 读取这样的表格: 输出这样的数据结果: 然而这样的结果却不是我们想要的,我们需要的是这样的结果: 1.安装python官方库 ...
- python打开excel的函数-Python读取excel文件中带公式的值的实现
在进行excel文件读取的时候,我自己设置了部分直接从公式获取单元格的值 但是用之前的读取方法进行读取的时候,返回值为空 import os import xlrd from xlutils.copy ...
- python可以读取excel文档吗_python打开excel文件【python读取excel文件如何进行】
Python语言打开Excel文件? 一.安装xlrd模 到python官网下http://pypi.python.org/pypi/xlrd模块安装,前已经安装python 环境. 二.使用介 1. ...
- python读取excel文件
python读取excel文件 1.pandas 读excel练习 2.测试程序: 3.实际使用 1.pandas 读excel练习 因为要真理一些excel中的工作内容,所以想用python脚本完成 ...
- python读取文件某一行-使用python读取.text文件特定行的数据方法
如何用python循环读取下面.txt文件中,用红括号标出来的数据呢? 首先,观察数据可知,不同行的第一个数据元素不一样,所以考虑直接用正则表达式. 再加上,对读和写文件的操作,就行了 注:我用的是p ...
- python读取文件多行内容-使用python读取.text文件特定行的数据方法
如何用python循环读取下面.txt文件中,用红括号标出来的数据呢? 首先,观察数据可知,不同行的第一个数据元素不一样,所以考虑直接用正则表达式. 再加上,对读和写文件的操作,就行了 注:我用的是p ...
- python读取文件_一日一技:使用Python读取Excel文件
安装xlrd模块: pip install xlrd 使用xlrd模块,可以从电子表格中检索信息. 例如,可以在Python中完成读取,写入或修改数据的操作. 另外,用户可能必须浏览各种工作表并根据某 ...
- python读取Excel文件是报(xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record; fo
python读取Excel文件是报(xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record; fo ...
最新文章
- react-native bundle --platform android --dev false --entry-file index.android.js --bundle-output and
- python和表格关系_python – 单表继承上的SQLAlchemy一对多关系...
- python重复字符串n次_python装饰器听了N次也没印象,读完这篇你就懂了
- vSphere 计算vMotion的迁移原理
- SAP CRM和Cloud for Customer的数据同步一例
- 基于Citus和ASP.NET Core开发多租户应用
- 十四、MySQL函数相关知识总结(简单易懂)
- 浅谈Jfinal急速开发框架
- bootstrap 点击按钮刷新_Spring Cloud 中的 Bootstrap 上下文
- Connection reset问题,INFO: I/O exception (java.net.SocketException) caught when processing reques
- 基于OpenCascade 与COIN3D的机械臂仿真测试
- t检验(t-test)临界值表(临界置信水平)
- RxSwift-MVVM
- ctf比赛的三种形式
- [Python]使用QRCode生成彩色二维码
- 关于Window10系统无法打开Microsoft Store(应用商店)解决方案
- spring使用ExcludeFilter和IncludeFilter
- java打字小游戏源码_求JAVA编写打字游戏源代码!
- LAZADA上传产品,“Seller is not verified”没有通过.产品审核是什么原因?怎么办?
- 【docker】gitlab + qqmail配置SMTP