又是美好的一天,如果大家因为PDF转word而烦恼的话可以尝试用用Python的PDFMiner3K,这是一个非常好用的库,下面是把任意PDF读成字符串,然后用stingio转化成文件对象:

#!/usr/bin/env python

# -*- coding:utf-8 -*-

#作者:どうでもいい菌

#网址:https://space.bilibili.com/450634867

from urllib.request import urlopen

from pdfminer.pdfinterp import PDFResourceManager,process_pdf

from pdfminer.converter import TextConverter

from pdfminer.layout import  LAParams

from io import StringIO

from io import open

import os

def readpdf(pdfile):

rsrcmgr = PDFResourceManager()

retstr = StringIO()

laparams = LAParams()

device = TextConverter(rsrcmgr,retstr,laparams = laparams)

process_pdf(rsrcmgr,device,pdfFile)

device.close()

content = retstr.getvalue()

retstr.close()

return content

while True:

Pdf_file_address = input('请输入文件地址:')

Txt_file_address = input('请输入输出文件地址:')

if os.path.exists(Pdf_file_address) and os.path.exists(Txt_file_address):

break

else:

print( "Sorry, I cannot find the address.")

pdfFile = open(str(Pdf_file_address),'rb')

outputString = readpdf(pdfFile)

print(outputString)

pdfFile.close()

fileewriter = open(str(Txt_file_address),'w')

fileewriter.write(outputString)

fileewriter.close()

print('已写入')

好了,以上就是所有代码了,详细教程和结果可以看视频学习,up会出 一起视频教程详细讲解操作过程的,有喜欢的小伙伴记得点赞哦!

python读取pdf内容转word_【python】python实现PDF转word相关推荐

  1. python中读取文件内容-Python读取文件内容的三种常用方式及效率比较

    本文实例讲述了Python读取文件内容的三种常用方式.分享给大家供大家参考,具体如下: 本次实验的文件是一个60M的文件,共计392660行内容. 程序一: def one(): start = ti ...

  2. python怎么读文件内容-Python读取文件内容为字符串的方法(多种方法详解)

    以下笔记是我在 xue.cn 学习群之数据分析小组所整理分享的心得.相关背景是:我选择中文词频统计案例作为考察大家python基础功掌握程度. 以小见大,下面是2个小技能的具体实战: 如何灵活地处理文 ...

  3. python火狐配置文件_Python+Selenium中级篇之4-封装一个自己的类-浏览器引擎类/Python读取配置文件内容...

    封装一个自己的类-浏览器引擎类 前一篇文章我们知道了,如何去封装几个简单的Selenium方法到我们自定义的类,这次我们编写一个类,叫浏览器引擎类,通过更改一个字符串的值,利用if语句去判断和控制启动 ...

  4. python excel 内容写入html,PYTHON读取EXCEL内容再转变成HTML添加到OUTLOOK中

    需求 读取excel里的表格里的内容,然后打开本机的outlook.把excel里的内容添加到正文里,注意.这里是要添加到正文!正文!正文!而不是添加到附件里 设计思路 1.excel处理 打开exc ...

  5. Python读取xlsx表格并转换成Python列表

    Python读取xlsx表格并转换成Python列表 参考链接https://www.cnblogs.com/ilovepython/p/11068841.html import xlrd from ...

  6. Python读取文件内容为字符串的方法(多种方法详解)

    方法1: 拷贝文章时,直接把内容赋值给一个变量,保存到一个 .py 文件中.然后在脚本中,导入它. 存储文章的文件article.py content = """ 复制的 ...

  7. python中读取文件内容-Python读取文件内容与存储

    Python读取与存储文件内容 一..csv文件 读取: importpandas as pd souce_data= pd.read_csv(File_Path) 其中File_path是文件的路径 ...

  8. python读取文件内容操作_Python 3.6 读取并操作文件内容

    下面为大家分享一篇Python 3.6 读取并操作文件内容的实例,具有很好的参考价值,希望对大家有所帮助.一起过来看看吧 所使用python环境为最新的3.6版本 Python中几种对文件的操作方法: ...

  9. python读取文件内容-Python读取文件内容与存储

    Python读取与存储文件内容 一..csv文件 读取: importpandas as pd souce_data= pd.read_csv(File_Path) 其中File_path是文件的路径 ...

最新文章

  1. 【Java源码分析】LinkedHashSet和HashSet源码分析
  2. AndroidStudio-使用Translations Editor
  3. Worktile:DNA中带有“效率”精神的协同软件企业
  4. Office文件的奥秘——.NET平台下不借助Office实现Word、Powerpoint等文件的解析(一)...
  5. JDK 9 –给圣诞老人的信?
  6. vscode的eslint无效_vscode配置eslint自动保存功能不生效
  7. eplan加密狗已损坏_EPLAN Electric P8 仿真加密狗 error 1068 问题
  8. 【汇编语言与计算机系统结构笔记12】序格式与伪操作:简化段的定义、操作符等
  9. 在Windows平台下载及安装 TensorFlow
  10. 51nod 1099 任务执行顺序
  11. 数据科学高级分析 (Data science advanced analytics)
  12. 如何将原生PDF转为纯图像Word?
  13. VBScript教程
  14. 优化 | 线性化:两个0-1变量相乘的线性化
  15. mysql锁历史记录_史上最全MySQL锁机制
  16. 用计算机弹出晴空,宠物小精灵之晴空之翼
  17. 【开源代码】在criteo数据集用MLP跑出AUC=0.809的结果
  18. 如何做好虾皮跨境电商?关于Shopee店铺快速开单的真相!
  19. 企微有客户流失提醒功能吗?如何设置?
  20. 网关末尾要么是1要么是254

热门文章

  1. APP测试基本流程以及APP测试要点梳理,成功入职就靠它了
  2. 解决maven打包 无法加载本地lib/下的jar包问题(程序包XXX不存在)
  3. ChatGPT版Office(Word/Excel/PPT)来了
  4. 不用管别人怎么评论自己_如何面对别人对自己的评价?
  5. 哥德尔不完全性定理 悖论式陈述 PM不可判定命题,和哥德尔可表达性定理——哥德尔读后之十八
  6. 马斯克被曝摆架子/ 朱晓彤卸任特斯拉中国法人/ 苹果M2Pro首发台积电3nm...今日更多新鲜事在此...
  7. java时间管理_IT 人,如何构建自己的时间管理系统?
  8. 一键打开多个软件 开发工具
  9. 第14期《成长之路》2017年8月刊
  10. DNS的工作原理及解析