前言

利用python读取 xlsxlsxcsvdocdocxpdf 格式的文件
python版本3.10.4

读取xls

pip install xlrd==2.0.1
wps的.et文件也可以读取

import xlrdwb = xlrd.open_workbook(path)# 获取所有工作表
for index,value in enumerate(wb.sheet_names()):sheet = wb[index]# 获取工作表总行数rows = sheet.nrows# 获取工作表总列数cols = sheet.ncols# 总行,总列# 获取某一单元格内容(行, 列),列表从0开始rfor r in range(0, rows):for c in range(0, cols):if sheet.cell(r, c).value:print(sheet.cell(r, c).value)

读取xlsx

pip install openpyxl==3.1.1

import openpyxl# 获取工作簿对象
wb = openpyxl.load_workbook(path)# 获取所有工作表
for index,value in enumerate(wb.sheetnames):sheet = wb[wb.sheetnames[index]]# 获取工作表总行数rows = sheet.max_row# 获取工作表总列数cols = sheet.max_column# 总行,总列# 获取某一单元格内容(行, 列),列表从1开始rfor r in range(1, rows + 1):for c in range(1, cols + 1):if sheet.cell(row=r, column=c).value:print(sheet.cell(row=r, column=c).value  )wb.close()

读取docx

from docx import Documentdocument = Document(path)
for paragraph in document.paragraphs:print(paragraph.text)

读取doc

需要先转为 docx,然后通过 docx 的方式读取

import win32com.client as wc
import os
import pythoncom# 解决 “尚未调用 CoInitialize” 问题
pythoncom.CoInitialize()
word = wc.Dispatch("Word.Application")# doc文件另存为docx,隐藏操作,不然会显示打开文件
word.Visible = False# 文件名包含空格会报错
os.rename(path, path.replace(" ", ""))doc = word.Documents.Open(path.replace(" ", ""))
doc.SaveAs(path[:-4] + ".docx", 12)
doc.Close()word.Quit()

读取pdf

安装 pip install pdfplumber==0.7.3

import pdfplumberwith pdfplumber.open(path) as pdf:for index,value in enumerate(pdf.pages):print(value.extract_text())

读取csv

import csvwith open(path, "r") as f:reader = csv.reader(f)for row in reader:print(row)

Python 系列:
读取文件 – 使用 python 读取 xls,xlsx,csv,doc,docx,pdf 格式的文件

阅读小工具 – 使用 python 开发无边框窗体阅读小工具

操作xlsx文件 – 使用 openpyxl 技术对 xlsx 的各种操作

前端系列:
扫雷游戏 – JavaScript 仿造 windows 编写 扫雷游戏

前端工具库 xlsx 处理表头合并 – 如何使用 xlsx 技术处理复杂的表头合并

CSS 布局技巧 – 对整体布局的心得体会

NVM Node 多版本控制教程 – Node 版本控制神器 NVM

Spring 系列:
Spring部署 – Spring 的多种 linux 部署方式

Spring实现策略模式 – 通过 Spring 实现多种策略模式

python读取 xls,xlsx,csv,doc,docx,pdf 格式的文件相关推荐

  1. python读取xls文件_从python中的xls读取unicode

    我正在尝试使用 Python读取.xls文件.该文件包含多个非ascii字符(即äöü).我已经尝试过使用openpyxls和xlrd(我对xlrd寄予厚望,因为它无论如何都会读取unicode中的所 ...

  2. Java导出大批量数据(文件格式篇xls,xlsx,csv)

    根据最近写出的导出方法 打算在文章中记录总结下学习心得 java导出我准备分为三篇文章介绍 分批查询导出篇https://blog.csdn.net/weixin_56567361/article/d ...

  3. Python读取xls文件报错:raise XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+‘; not supported‘)

    Python读取xls文件报错:raise XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+': not supported') 只需要下载pyexce ...

  4. PDF 格式的文件编辑难度非常大,相比 .docx格式,它存在的意义是什么?

    知乎上有个热门问题,PDF 格式的文件编辑难度非常大,相比 .docx格式,它存在的意义是什么? 回答这个问题得承认一个大前提,PDF是用来查看的,而不是编辑的. 否则就相当于提问,詹姆斯的足球踢得并 ...

  5. 【Python】python实现jpg图片文字转成pdf格式

    python实现jpg图片文字转成pdf格式 [代码][Python]代码 #!/usr/bin/env pythonimport os import sys from reportlab.lib.p ...

  6. 带中文的网页下载为PDF格式的文件(jsPDF)

    1.调研 主要需要用到插件jsPDF,jsPDF可以将html下载为pdf格式的文件,但无法支持中文字形,下载带中文的网页会有乱码,经验证可以通过如下3种方案下载中文网页. 2.方案 2.1.方案一( ...

  7. 电脑电子版文件怎么弄_电脑上怎么制作pdf格式的文件?

    原标题:电脑上怎么制作pdf格式的文件? 我们经常会遇到情况是需要转换文档为PDF格式,这种条件下只能称作为转换为PDF文件,用格式转换工具就能完成,不能算得上是制作一个pdf文件.那么,想要自己在电 ...

  8. 怎么制作pdf格式的文件?操作多就懂了

    有时候,很多小伙伴会奇怪,好奇pdf文件是怎么出来的,因为它难以被编辑,而且好像没啥工具可以直接制作它.其实,大多数的pdf文件都是人们使用常见的office工具,把word文档.excel表格或者p ...

  9. Word怎么转换成PDF格式的文件

    Word怎么转换成PDF格式的文件?现在很多办公室都会接触到类似的问题,对于普通员工来说,领导说什么就是什么,领导让怎么做就得怎么做.小编每天都是各种资料和报告,领导前几日有发了不少Word文件让我想 ...

最新文章

  1. class h5 点击后样式变化_H5学习笔记
  2. 在ASP.NET中使用Global.asax文件
  3. Spring Cloud Edgware新特性之八:Zuul回退的改进
  4. 工信部推动第二批“5G+工业互联网”实践的通知
  5. eclipse jdk配置_eclipse的安装和jdk的配置(JAVA)
  6. EDA实验课课程笔记(四)——TCL脚本语言的学习2
  7. 记录一次有意思的XSS过滤绕过
  8. LeetCode:完全平方数【279】【DP】
  9. 解决POI读取Excel内存溢出的问题
  10. ubuntu环境下安装opencv教程及测试
  11. 强烈推荐代码生成器Cursor
  12. Windows图标-Icon文件格式分析
  13. windows配置DNS
  14. java 定时器 倒计时_Java:多种方式实现倒计时定时器
  15. mysql数据源配置
  16. Gym - 102569A
  17. SU10批量处理用户
  18. Proteus 网络名的添加
  19. 【杂谈】中国黑客致中国黑客和红客的公开信
  20. 图片的不同分类以及特性

热门文章

  1. 概率论基础知识(二) 随机变量及其分布
  2. ps在褶皱T恤上贴上图案
  3. 微信小程序分享功能(微信好友,朋友圈)
  4. [CF1292C] Xenon's Attack on the Gangs
  5. MySQL数据结构选择的合理性
  6. 【跟我一起学Unity3D】做一个2D的90坦克大战之地图编辑器
  7. pycharm打包程序
  8. vue+element 在ie和360浏览器的兼容问题
  9. ps解决导出图片自动裁剪导致的图像位置偏移的问题
  10. 二代征信报告解读及信贷风控中的应用