大数据处理经常要用到一堆表格,然后需要把数据导入一个list中进行各种算法分析,简单讲一下自己的做法:

1.如何读取excel文件

网上的版本很多,在xlrd模块基础上,找到一些源码:

import xdrlib ,sys

import xlrd

def open_excel(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xlsx"):

data = xlrd.open_workbook(file)

return data

#根据索引获取Excel表格中的数据 参数:file:Excel文件路径 colnameindex:表头列名所在行的所以 ,by_index:表的索引

def excel_table_byindex(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xlsx",colnameindex=0,by_index=0):

data = open_excel(file)

table = data.sheets()[by_index]

nrows = table.nrows #行数

ncols = table.ncols #列数

colnames = table.row_values(colnameindex) #某一行数据

list =[]

for rownum in range(1,nrows):

row = table.row_values(rownum)

if row:

app = {}

for i in range(len(colnames)):

app[colnames[i]] = row[i]

list.append(app)

return list

#根据名称获取Excel表格中的数据 参数:file:Excel文件路径 colnameindex:表头列名所在行的所以 ,by_name:Sheet1名称

def excel_table_byname(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xlsx",colnameindex=0,by_name=u'Sheet1'):

data = open_excel(file)

table = data.sheet_by_name(by_name)

nrows = table.nrows #行数

colnames = table.row_values(colnameindex) #某一行数据

list =[]

for rownum in range(1,nrows):

row = table.row_values(rownum)

if row:

app = {}

for i in range(len(colnames)):

app[colnames[i]] = row[i]

list.append(app)

return list

def main():

tables = excel_table_byindex()

for row in tables:

print(row)

tables = excel_table_byname()

for row in tables:

print(row)

if __name__=="__main__":

main()

最后一句是重点,所以这里也给代码人点个赞!

最后一句让代码里的函数都可以被复用,简单地说:假设文件名是a,在程序中import a以后,就可以用a.excel_table_byname()和a.excel_table_byindex()这两个超级好用的函数了。

2.然后是遍历文件夹取得excel文件以及路径:,原创代码如下:

import os

import xlrd

import test_wy

xpath="E:/唐伟捷/电力/电力系统总文件夹/舟山电力"

xtype="xlsx"

typedata = []

name = []

raw_data=[]

file_path=[]

def collect_xls(list_collect,type1):

#取得列表中所有的type文件

for each_element in list_collect:

if isinstance(each_element,list):

collect_xls(each_element,type1)

elif each_element.endswith(type1):

typedata.insert(0,each_element)

return typedata

#读取所有文件夹中的xls文件

def read_xls(path,type2):

#遍历路径文件夹

for file in os.walk(path):

for each_list in file[2]:

file_path=file[0]+"/"+each_list

#os.walk()函数返回三个参数:路径,子文件夹,路径下的文件,利用字符串拼接file[0]和file[2]得到文件的路径

name.insert(0,file_path)

all_xls = collect_xls(name, type2)

#遍历所有type文件路径并读取数据

for evey_name in all_xls:

xls_data = xlrd.open_workbook(evey_name)

for each_sheet in xls_data.sheets():

sheet_data=test_wy.excel_table_byname(evey_name,0,each_sheet.name)

#请参考读取excel文件的代码

raw_data.insert(0, sheet_data)

print(each_sheet.name,":Data has been done.")

return raw_data

a=read_xls(xpath,xtype)

print("Victory")

欢迎各种不一样的想法。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

python批量读取文件夹中的所有excel文件-python遍历文件夹下所有excel文件相关推荐

  1. json字段顺序读取 python_如何利用Python批量读取视频文件的时间长度?

    本期的主题是利用Python来实现对视频文件时间长度的读取. 在学习编程语言时,相比较于通过书本来学习知识,我更喜欢通过观看学习视频的方式来进行学习,通过主讲老师的讲解,我能很直观且快速的了解一些知识 ...

  2. python 批量读取csv_python批量读取csv文件

    请问大神怎样用python批量读取文件夹下的文件? python如何读取CSV文件一部分数据 Python如何批量读取CSV文件并写入TXT? 如何用python把多个csv文件数据处理后汇总到新cs ...

  3. python批量提取word指定内容_使用python批量读取word文档并整理关键信息到excel表格的实例...

    目标 最近实验室里成立了一个计算机兴趣小组 倡议大家多把自己解决问题的经验记录并分享 就像在CSDN写博客一样 虽然刚刚起步 但考虑到后面此类经验记录的资料会越来越多 所以一开始就要做好模板设计(如下 ...

  4. python批量导入mysql_用python批量向数据库(MySQL)中导入数据

    用python批量向数据库(MySQL)中导入数据 现有数十万条数据,如下的经过打乱处理过的数据进行导入 数据库内部的表格的数据格式如下与下面的表格结构相同 Current database: pyt ...

  5. python批量读取图片gps位置_某少儿不宜网站图片拍摄位置分析,Python批量读取图片GPS位置!...

    原标题:某少儿不宜网站图片拍摄位置分析,Python批量读取图片GPS位置! 1. python读取图片exif属性中的GPS信息 智能手机或平板如果在拍照时开启定位服务,照片中就会记录拍照位置信息和 ...

  6. 我用Python批量读取考生成绩单,并自动发送录取通知书邮件

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 欢笑情如旧,萧疏鬓已斑. 01 前 ...

  7. python 数据导入mysql_用python批量向数据库(MySQL)中导入数据

    用python批量向数据库(MySQL)中导入数据 现有数十万条数据,如下的经过打乱处理过的数据进行导入 数据库内部的表格的数据格式如下与下面的表格结构相同Current database: pyth ...

  8. python怎么批量下载年报_使用Python批量下载Wind数据库中的PDF报告

    原标题:使用Python批量下载Wind数据库中的PDF报告 背景 最近小编出于工作需要,准备在Wind金融数据终端批量下载上市公司2019年第一季度业绩预告.通过相关的条件检索,发现其相关数据有近百 ...

  9. 自动化神器啊,Python 批量读取身份证信息写入 Excel

    大家好,今天分享一个实用技能,利用 Python 批量读取身份证信息写入 Excel. 喜欢记得收藏.关注.点赞. 注:文末提供完整版代码.技术交流方式 读取 以图片形式的身份证为例,信息读取我们使用 ...

  10. 【文件IO】Linux 文件操作(一) —— 遍历指定目录下的所有文件

    目录 一.访问目录相关函数 1.打开/访问目录 (opendir / fdopendir) 2.读取目录内容 (readdir) 3.关闭目录 (closedir) 二.遍历指定目录下的所有文件 一. ...

最新文章

  1. 几个表示“光”的概念
  2. 设置在桌面上不显示计算机,怎么在桌面上显示我的电脑 我的电脑桌面不显示怎么办...
  3. STM32 基础系列教程 38 - Lwip_http
  4. mysql与配偶同性_mysql 左,右,内连接
  5. 快乐数(双指针,哈希表)
  6. linux父进程中显示子进程pid,请教linux下c语言函数fork父进程打印子进程的PID
  7. 用双网卡做代理服务器设置具体步骤
  8. druid读取hdfs文件
  9. 本地开发好的 SAP Fiori Elements 应用,如何部署到 ABAP 服务器上?
  10. idea无法创建class
  11. 全网最简单的k8s User JWT token管理器
  12. [九省联考2018] 一双木棋 chess
  13. 杭电2567寻梦(字符串处理)
  14. 8款精致的纯CSS3按钮特效
  15. 给ssh服务添加谷歌双重认证
  16. [Android]高通平台BootLoader启动流程
  17. 软件定义汽车的关键—车载操作系统
  18. 头歌:打印直角三角形
  19. 关于Python虚拟环境与包管理你应该知道的事
  20. matlab实现图片锐化处理

热门文章

  1. pwdencrypt,pwdcompare
  2. Redis使用及工具类
  3. spring --AOP
  4. javaScript知识点大全
  5. 3、iOS Xcode创建protocol(代理).h文件
  6. WIN7 X64 Setup Oracle Developer Suite 10g
  7. Extjs学习笔记--(五,事件)
  8. 【搜】mysql压缩包减肥
  9. php dirname(__FILE__)
  10. 细数Ajax Control Toolkit 34个服务器端控件