pdf转word应该算是一个很常见的需求了网上有些免费的转换工具,一方面不安全,有文件泄露风险,另一方面有免费转换的次数限制。

今天向大家分享一个很好用的工具:pdf2docx

安装

$ pip install pdf2docx

用法也很简单,核心方法是Converter
我写了一个小脚本,如有需要,大家可以直接copy走。

# -*- coding: utf-8 -*-
"""
Created on Sat Aug  7 16:36:59 2021@author: LaoHu
"""
import argparse
from pdf2docx import Converterdef main(pdf_file,docx_file):cv = Converter(pdf_file)cv.convert(docx_file, start=0, end=None)cv.close()if __name__ == "__main__":parser = argparse.ArgumentParser()parser.add_argument("--pdf_file",type=str)parser.add_argument('--docx_file',type=str)args = parser.parse_args()main(args.pdf_file,args.docx_file)

用法

python pdf2word.py --pdf_file  pdf文件路径\example.pdf --docx_file 输出word文件的路径\example.docx

不喜欢命令行跑脚本的同学可以copy下面简化版

from pdf2docx import Converter
pdf_file = 'pdf文件路径'
docx_file = '输出word文件的路径'
cv = Converter(pdf_file)
cv.convert(docx_file, start=0, end=None)
cv.close()

各位伙伴们好,詹帅本帅假期搭建了一个个人博客和小程序,汇集各种干货和资源,也方便大家阅读,感兴趣的小伙伴请移步小程序体验一下哦!(欢迎提建议)

推荐阅读

牛逼!Python常用数据类型的基本操作(长文系列第①篇)

牛逼!Python的判断、循环和各种表达式(长文系列第②篇)

牛逼!Python函数和文件操作(长文系列第③篇)

牛逼!Python错误、异常和模块(长文系列第④篇)

6行代码!用Python将PDF转为word相关推荐

  1. 用Python把PDF转为Word方法总结

    先讲一下为啥要写这个文章,网上其实很多这种PDF转化的代码和软件.我一直想用Python做,但是网上搜到的代码很多都不能用,很多是2.7版本的代码,再就是PDF需要用到的库在导入的时候,很多的报错,解 ...

  2. python实现pdf转word详解_手把手|20行Python代码教你批量将PDF文件转为Word格式(包教包会)...

    在日常工作或学习中,经常会遇到这样的无奈: "小任,你把这个PDF中的文件码出来发我" 倒霉,2M的PDF12点也完不了啊! 很多时候在学习时发现许多文档都是PDF格式,PDF格式 ...

  3. c 语言500行小游戏代码,500行代码使用python写个微信小游戏飞机大战游戏.pdf

    500行行代代码码使使用用python写写个个微微信信小小游游戏戏飞飞机机大大战战游游戏戏 这篇文章主要介绍了500行代码使用python写个微信小游戏飞机大战游戏,本文通过实例代码给大家介绍的非常详 ...

  4. 如何用python把pdf转为word_Python-PDF转为Word

    手把手 | 20行Python代码教你批量将PDF转为Word 作者|丁彦军 给各位带来了一个免费简单快速的方法,手把手教你用Python批量处理PDF格式文件,获取自己想要的内容,存为word形式. ...

  5. 利用python将PDF转为PPT(课件专用)

    利用python将PDF转为PPT(课件专用) 前言:课程中老师经常会将课件作为PDF发放而非PPT,而现有的PDF阅读器一般不支持添加修改等操作,所以显得十分麻烦,考虑将PDF转换为PPT格式,方便 ...

  6. python 数据比对 函数_1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源...

    原标题:1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源

  7. python代码翻译-10 行代码,Python 教你自制屏幕翻译工具,有逼格!!

    原标题:10 行代码,Python 教你自制屏幕翻译工具,有逼格!! 1. 场景 大家如果平常遇到不认识的英文,相信大部分的人都会复制内容后,使用翻译软件,或者拷贝到网站上去执行翻译. 当然,对于 I ...

  8. python爬虫代码1000行-最精简的爬虫 --仅需4行代码(python)

    最精简的爬虫 --仅需4行代码(python) 刚刚整理了下爬虫系列,于是乎就开始了第一次的技术分享 今天,我们主要讲述的是思路,思路,思路. 相比起,直接贴代码,思路显的更为重要 当初,自己的坑,希 ...

  9. 最简单的爬虫代码 python_最精简的爬虫 --仅需4行代码(python)

    最精简的爬虫 --仅需4行代码(python) 刚刚整理了下爬虫系列,于是乎就开始了第一次的技术分享 今天,我们主要讲述的是思路,思路,思路. 相比起,直接贴代码,思路显的更为重要 当初,自己的坑,希 ...

最新文章

  1. matlab内存管理
  2. 如何快速清空 Linux 中的大文件
  3. 爬取百度网盘资源报user is not authorized, hitcode:119
  4. Kafka Connect简介
  5. Java 最高均薪 19015 元! 8 月程序员工资出炉,你拖后腿了吗?
  6. Win7系统默认浏览器的更改教程
  7. C++之操作符重载探究(三):输出操作符重载
  8. Python最大公约数gcd、最小公倍数lcm
  9. curl 请求日志_Java 日志实践:简明配置、日志抽样和级别动态修改
  10. 运用li元素进行斑马色显示
  11. 西南科技大学OJ题 平衡二叉树的判定1077
  12. asr语音转写_利用Real-time ASR语音转写服务实现直播实时弹幕提升用户体验
  13. .Net Core MVC使用EF
  14. 9 tlds tomcat_解决Tomcat 7日志At least one JAR was scanned for TLDs...问题
  15. 张量的基本概念+张量的聚合、拼接、比较、随机化采样、序列化等操作+升维、降维
  16. C#编程-39:字符和字符串笔记
  17. 私有化短链接管理系统-魔众短链接系统 v1.0.0
  18. 电阻(6)限流、分压、采样、频率特性篇
  19. 回复英文审稿人意见常用格式
  20. 计算机主板电杆,嵌入式主板的常见故障解决办法

热门文章

  1. linux – 我怎么知道我到somaxconn有多近?
  2. 连接MongoDB 3.x 报 Authorization failed 解决办法(创建账号的部分亲测)
  3. 五天面试 Google、Facebook、Airbnb 等硅谷五家顶级公司,我是如何都拿到 Offer 的
  4. PHP经典算法 (转载)
  5. php Xdebug的安装与使用详解
  6. xhprof windows下安装和使用(windows版本)
  7. lisp java_ai lisp java
  8. 屏幕自动亮度不停的变_LCD最后的荣耀?卢伟冰:我们的屏幕比iPhone11更优秀
  9. ddr5内存上市时间_辣评烩:SK海力士首发DDR5内存:频率冲上5600MHz
  10. 必要商城MySQL开发规范