用python实现各种文件类型转换
一、word转pdf
先安装win32库:pip install pywin32
from win32com.client import gencache
from win32com.client import constants, gencachedef createPdf(wordPath, pdfPath):"""word转pdf:param wordPath: word文件路径:param pdfPath: 生成pdf文件路径"""word = gencache.EnsureDispatch('Word.Application')doc = word.Documents.Open(wordPath, ReadOnly=1)doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF,Item=constants.wdExportDocumentWithMarkup,CreateBookmarks=constants.wdExportCreateHeadingBookmarks)word.Quit(constants.wdDoNotSaveChanges)createPdf('D:\桌面\论文阅读笔记.docx','D:\桌面\论文阅读笔记.pdf')
运行结果:
二、excel转pdf
# Import Module
from win32com import client# Open Microsoft Excel
excel = client.Dispatch("Excel.Application")# Read Excel File
sheets = excel.Workbooks.Open('F:\书籍借阅信息.xlsx')
work_sheets = sheets.Worksheets[0]# Convert into PDF File
work_sheets.ExportAsFixedFormat(0, 'F:\书籍借阅信息.pdf')# 关闭服务
excel.Quit()
运行结果:
三、ppt转pdf
# 1). 导入需要的模块(打开应用程序的模块)
import win32com.client
import os
def ppt2pdf(filename, output_filename):"""PPT文件导出为pdf格式:param filename: PPT文件的名称:param output_filename: 导出的pdf文件的名称:return:"""# 2). 打开PPT程序ppt_app = win32com.client.Dispatch('PowerPoint.Application')# ppt_app.Visible = True # 程序操作应用程序的过程是否可视化# 3). 通过PPT的应用程序打开指定的PPT文件# filename = "C:/Users/Administrator/Desktop/PPT办公自动化/ppt/PPT素材1.pptx"# output_filename = "C:/Users/Administrator/Desktop/PPT办公自动化/ppt/PPT素材1.pdf"ppt = ppt_app.Presentations.Open(filename)# 4). 打开的PPT另存为pdf文件。17数字是ppt转图片,32数字是ppt转pdf。ppt.SaveAs(output_filename, 32)print("导出成pdf格式成功!!!")# 退出PPT程序ppt_app.Quit()# 要处理的目录名称
dirname = 'D:\桌面\智能算法设计与实现'
# 列出指定目录的内容
filenames = os.listdir(dirname)
# for循环依次访问指定目录的所有文件名
for filename in filenames:# 判断文件的类型,对所有的ppt文件进行处理(ppt文件以ppt或者pptx结尾的)if filename.endswith('ppt') or filename.endswith('pptx'):# print(filename) # PPT素材1.pptx -> PPT素材1.pdf# 将filename以.进行分割,返回2个信息,文件的名称和文件的后缀名base, ext = filename.split('.') # base=PPT素材1 ext=pdfnew_name = base + '.pdf' # PPT素材1.pdf# ppt文件的完整位置: C:/Users/Administrator/Desktop/PPT办公自动化/ppt/PPT素材1.pptxfilename = dirname + '/' + filename# pdf文件的完整位置: C:/Users/Administrator/Desktop/PPT办公自动化/ppt/PPT素材1.pdfoutput_filename = dirname + '/' + new_name# 将ppt转成pdf文件ppt2pdf(filename, output_filename)
运行结果:
四、图片转pdf
from PIL import Image
import os# 防止字符串乱码
os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8'def pic2pdf(img_path, pdf_path):file_list = os.listdir(img_path)for x in file_list:if "jpg" in x or 'png' in x or 'jpeg' in x:pdf_name = x.split('.')[0]im1 = Image.open(os.path.join(img_path, x))im1.save(pdf_path + pdf_name + '.pdf', "PDF", resolution=100.0)if __name__ == '__main__':# 待转换图像路径img_path = r"D:\桌面\\"# 转换后的pdf存放路径pdf_path = r'D:\桌面\\'pic2pdf(img_path=img_path, pdf_path=pdf_path)
五、pdf转word
先安装:pip install pdf2docx
from pdf2docx import Converter
pdf_file = r'D:\桌面\论文阅读笔记.pdf'
docx_file = r'D:\桌面\论文阅读笔记.docx'
cv = Converter(pdf_file)
cv.convert(docx_file, start=0, end=None)
cv.close()
六、pdf转图片
先安装:pip install pdf2image
from pdf2image import convert_from_path
pages = convert_from_path('D:\桌面\论文阅读笔记.pdf', 500)# 保存
for page in pages:page.save('D:\桌面\论文阅读笔记.jpg', 'JPEG')
七、csv转excel
import pandas as pd
data = pd.read_csv('F:/train.csv',index_col=0)
data.to_excel('F:/train.xlsx',encoding='utf-8')
八、excel转csv
import pandas as pd
data = pd.read_excel('F:/train.xlsx',index_col=0)
data.to_csv('F:/train.csv',encoding='utf-8')
用python实现各种文件类型转换相关推荐
- python中读取文件内容-深入学习python解析并读取PDF文件内容的方法
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
- 用Python读取CSV文件的5种方式
典型的数据集stocks.csv: 一个股票的数据集,其实就是常见的表格数据.有股票代码,价格,日期,时间,价格变动和成交量.这个数据集其实就是一个表格数据,有自己的头部和身体. 第一招:简单的读取 ...
- 哇!用Python读取CVS文件竟然有5招,据说90%的人只会2招
Python目前是最火的语言了,无论是做开发,测试,数据分析,后端,还是办公自动化都可以用Python帮你轻松解决一些琐碎的.尤其是一些重复的工作,而在日常的工作中经常打交道的就是文件的处理,其中CS ...
- 通过Python实现NC文件转GeoTiff格式
通过Python实现NC文件转GeoTiff格式 〇.目录 通过Python实现NC文件转GeoTiff格式 一.前言 二.基本了解 三.功能实现 四.成图预览 五.参考 六.总结 一.前言 基于Py ...
- python读取pdf文件_深入学习python解析并读取PDF文件内容的方法
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
- python向json文件写入中文信息
''' 功能:python向json文件写入中文信息: 创建json数据. ''' import jsonorder_info={'订单需求信息': {'订单任务编号':'','观测目标名称':'', ...
- python object类型转换,Python对象比较和类型转换
Python对象比较和类型转换 1.Python核心数据类型 数字:int, long, float, complex(复数), bool(布尔) 字符:str, unicode 列表:list 字典 ...
- python读取xml文件报错ValueError: multi-byte encodings are not supported
1.在使用python对xml文件进行读取时,提示ValueError: multi-byte encodings are not supported 很多贴子上说把xml的编码格式改为,就可以正常执 ...
- Python监控目录文件夹,并使用SFTP上传目录及文件到linux服务器
Python 扫描监控本地文件夹并进行超大文件上传 方案1:WebUploader大文件分块多线程并发上传 方案2:watchdog目录文件夹监控,paramiko STFP上传服务器 方案3:优化2 ...
最新文章
- python【蓝桥杯vip练习题库】ADV-187 勾股数
- c++-initializer_list
- springboot整合spring @Cache和Redis
- nth-child(n)和nth-of-type(n)
- Oracle中insert into select和select into的区别
- python中递归函数写法_python中递归函数如何创建
- STM32那点事(3)_中断(上)
- 字符流的抽象类 java
- arp协议属于哪一层_网络工程师(3):详解ARP协议
- PDF模板报表导出(Java+Acrobat+itext)
- javascript三元操作符
- Java中的System.getProperty()设置参数的方法
- 自然电位测井 基本原理、测量方法、曲线规律、曲线用途
- javaweb项目电子商城购物系统课程设计任务书及成绩评定和毕业设计与实现
- 海康摄像头车牌识别和顶拍同步抓拍图片
- ORA-39097:Data Pump job encountered unexpected error 06502
- 微信小程序实现地图导航功能
- javax.crypto.Cipher类--加密和解密
- 开发板给电脑自动分配IP?手把手教部署零配置网络实现电脑与开发板直连
- 计算机主机显卡安装,电脑显卡安装的图文教程