python读取pdf内容转word_【python】python实现PDF转word
又是美好的一天,如果大家因为PDF转word而烦恼的话可以尝试用用Python的PDFMiner3K,这是一个非常好用的库,下面是把任意PDF读成字符串,然后用stingio转化成文件对象:
#!/usr/bin/env python
# -*- coding:utf-8 -*-
#作者:どうでもいい菌
#网址:https://space.bilibili.com/450634867
from urllib.request import urlopen
from pdfminer.pdfinterp import PDFResourceManager,process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from io import StringIO
from io import open
import os
def readpdf(pdfile):
rsrcmgr = PDFResourceManager()
retstr = StringIO()
laparams = LAParams()
device = TextConverter(rsrcmgr,retstr,laparams = laparams)
process_pdf(rsrcmgr,device,pdfFile)
device.close()
content = retstr.getvalue()
retstr.close()
return content
while True:
Pdf_file_address = input('请输入文件地址:')
Txt_file_address = input('请输入输出文件地址:')
if os.path.exists(Pdf_file_address) and os.path.exists(Txt_file_address):
break
else:
print( "Sorry, I cannot find the address.")
pdfFile = open(str(Pdf_file_address),'rb')
outputString = readpdf(pdfFile)
print(outputString)
pdfFile.close()
fileewriter = open(str(Txt_file_address),'w')
fileewriter.write(outputString)
fileewriter.close()
print('已写入')
好了,以上就是所有代码了,详细教程和结果可以看视频学习,up会出 一起视频教程详细讲解操作过程的,有喜欢的小伙伴记得点赞哦!
python读取pdf内容转word_【python】python实现PDF转word相关推荐
- python中读取文件内容-Python读取文件内容的三种常用方式及效率比较
本文实例讲述了Python读取文件内容的三种常用方式.分享给大家供大家参考,具体如下: 本次实验的文件是一个60M的文件,共计392660行内容. 程序一: def one(): start = ti ...
- python怎么读文件内容-Python读取文件内容为字符串的方法(多种方法详解)
以下笔记是我在 xue.cn 学习群之数据分析小组所整理分享的心得.相关背景是:我选择中文词频统计案例作为考察大家python基础功掌握程度. 以小见大,下面是2个小技能的具体实战: 如何灵活地处理文 ...
- python火狐配置文件_Python+Selenium中级篇之4-封装一个自己的类-浏览器引擎类/Python读取配置文件内容...
封装一个自己的类-浏览器引擎类 前一篇文章我们知道了,如何去封装几个简单的Selenium方法到我们自定义的类,这次我们编写一个类,叫浏览器引擎类,通过更改一个字符串的值,利用if语句去判断和控制启动 ...
- python excel 内容写入html,PYTHON读取EXCEL内容再转变成HTML添加到OUTLOOK中
需求 读取excel里的表格里的内容,然后打开本机的outlook.把excel里的内容添加到正文里,注意.这里是要添加到正文!正文!正文!而不是添加到附件里 设计思路 1.excel处理 打开exc ...
- Python读取xlsx表格并转换成Python列表
Python读取xlsx表格并转换成Python列表 参考链接https://www.cnblogs.com/ilovepython/p/11068841.html import xlrd from ...
- Python读取文件内容为字符串的方法(多种方法详解)
方法1: 拷贝文章时,直接把内容赋值给一个变量,保存到一个 .py 文件中.然后在脚本中,导入它. 存储文章的文件article.py content = """ 复制的 ...
- python中读取文件内容-Python读取文件内容与存储
Python读取与存储文件内容 一..csv文件 读取: importpandas as pd souce_data= pd.read_csv(File_Path) 其中File_path是文件的路径 ...
- python读取文件内容操作_Python 3.6 读取并操作文件内容
下面为大家分享一篇Python 3.6 读取并操作文件内容的实例,具有很好的参考价值,希望对大家有所帮助.一起过来看看吧 所使用python环境为最新的3.6版本 Python中几种对文件的操作方法: ...
- python读取文件内容-Python读取文件内容与存储
Python读取与存储文件内容 一..csv文件 读取: importpandas as pd souce_data= pd.read_csv(File_Path) 其中File_path是文件的路径 ...
最新文章
- 【Java源码分析】LinkedHashSet和HashSet源码分析
- AndroidStudio-使用Translations Editor
- Worktile:DNA中带有“效率”精神的协同软件企业
- Office文件的奥秘——.NET平台下不借助Office实现Word、Powerpoint等文件的解析(一)...
- JDK 9 –给圣诞老人的信?
- vscode的eslint无效_vscode配置eslint自动保存功能不生效
- eplan加密狗已损坏_EPLAN Electric P8 仿真加密狗 error 1068 问题
- 【汇编语言与计算机系统结构笔记12】序格式与伪操作:简化段的定义、操作符等
- 在Windows平台下载及安装 TensorFlow
- 51nod 1099 任务执行顺序
- 数据科学高级分析 (Data science advanced analytics)
- 如何将原生PDF转为纯图像Word?
- VBScript教程
- 优化 | 线性化:两个0-1变量相乘的线性化
- mysql锁历史记录_史上最全MySQL锁机制
- 用计算机弹出晴空,宠物小精灵之晴空之翼
- 【开源代码】在criteo数据集用MLP跑出AUC=0.809的结果
- 如何做好虾皮跨境电商?关于Shopee店铺快速开单的真相!
- 企微有客户流失提醒功能吗?如何设置?
- 网关末尾要么是1要么是254
热门文章
- APP测试基本流程以及APP测试要点梳理,成功入职就靠它了
- 解决maven打包 无法加载本地lib/下的jar包问题(程序包XXX不存在)
- ChatGPT版Office(Word/Excel/PPT)来了
- 不用管别人怎么评论自己_如何面对别人对自己的评价?
- 哥德尔不完全性定理 悖论式陈述 PM不可判定命题,和哥德尔可表达性定理——哥德尔读后之十八
- 马斯克被曝摆架子/ 朱晓彤卸任特斯拉中国法人/ 苹果M2Pro首发台积电3nm...今日更多新鲜事在此...
- java时间管理_IT 人,如何构建自己的时间管理系统?
- 一键打开多个软件 开发工具
- 第14期《成长之路》2017年8月刊
- DNS的工作原理及解析