在日常中有时需将 html 文件转换为 pdf、word 文件。网上免费的大多数不支持多个文件转换的情况,而且在转换几个后就开始收费了。

转 pdf

转 pdf 中使用 pdfkit 库,它可以让 web 网页直接转为 pdf 文件,多个 url 可以合并成一个文件。

安装 pdfkit 库

pip3 install pdfkit

安装 wkhtmltopdf 文件

pdfkit 是基于 wkhtmltopdf 的 python 封装库,所以需要安装 wkhtmltopdf 软件。

下载地址:https://wkhtmltopdf.org/downloads.html

在windows 系统中,需要将 wkhtmltopdf.exe 文件路径配置在系统环境变量中。

url 生成 pdf

这里使用 baidu 首页和 bing 首页作为示例

import pdfkit# 第一个参数可以是列表,放入多个域名,第二个参数是生成的 PDF 名称
pdfkit.from_url(['www.baidu.com','www.bing.com'],'search.pdf')

本地 html 文件生成 pdf

提前将需要转换的 html 存储到本地,也可以使用 python 爬虫代码抓取 html 文件到本地。

import pdfkitpdfkit.from_file('/Users/xx/Desktop/html/baidu.html', 'search.pdf')

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:721195303

转 word

使用 pypandoc 库将 html 转换为 word 文件,pypandoc 是一个支持多种文件格式转换的 Python 库,它用到了 pandoc 软件,所以需要在电脑上安装 pandoc 软件

安装 pypandoc 库

pip install pypandoc

安装 pandoc 软件

pypandoc 是基于 pandoc 软件的库,所以要安装一下 pandoc (https://github.com/jgm/pandoc/releases/tag/2.11.4),pandoc 支持多种类型转换。下图是 pandoc 的转换类型。

使用

将 html 文件提前存储在本地,也可以用爬虫将需要转换的 html 文件在代码中抓取后使用。

import pypandoc# convert_file('原文件','目标格式','目标文件')
output = pypandoc.convert_file('/Users/xx/Desktop/html/baidu.html', 'docx', outputfile="baidu.doc")

pypandoc 无法对 word 进行排版,所以需要小伙伴们进行 2 次排版。

总结

利用好 Python 第三方库类,可以为小伙伴写出各种个性化定制的小程序

在这里还是要推荐下我自己建的Python学习群:721195303,群里都是学Python的,如果你想学或者正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2021最新的Python进阶资料和零基础教学,欢迎进阶中和对Python感兴趣的小伙伴加入!

用 Python 将 html 转为 pdf、word相关推荐

  1. Share实例:用python将ppt转为pdf

    目录 基本环境 模块安装 代码 关于环境变量 pip相关 优化扩展:Python:将当前目录下Word和PPT转为PDF 代码参考:用Python将PPT转换PDF 引用代码很详细了,有注释真不戳. ...

  2. python将数字转为0010_用Python将HTML转为PDF。

    上期提到了如何获取公众号文章信息,这回就说下怎么将网页转为PDF,方便平常学习. 然后扩散一下之前一个比赛的结果(华章计算机抖音大赛). 顺便谈谈自己对今后送书的一个想法. 另外之前的送书活动,有中奖 ...

  3. python将html存为pdf_用Python将HTML转为PDF。

    上期提到了如何获取公众号文章信息,这回就说下怎么将网页转为PDF,方便日常学习.html 而后扩散一下以前一个比赛的结果(华章计算机抖音大赛).数据库 顺便谈谈本身对从此送书的一个想法.微信 另外以前 ...

  4. python html转pdf 调整大小_用Python将HTML转为PDF。

    上期提到了如何获取公众号文章信息,这回就说下怎么将网页转为PDF,方便平常学习. 然后扩散一下之前一个比赛的结果(华章计算机抖音大赛). 顺便谈谈自己对今后送书的一个想法. 另外之前的送书活动,有中奖 ...

  5. word文档转为PDF以及多种文档格式转换

    word文档转为PDF以及多种文档格式转换 项目地址:https://gitee.com/Jakewabc/word-of-pdf.git 相关案例: https://github.com/aspos ...

  6. 使用python批量将word转为pdf

    前言 最近遇到一个问题,打印大量的word,自知word在不同打印店格式可能会发生变化,于是就想去将其转为pdf,在百度上去搜索,无奈搜不到相关程序,于是就使用英语去搜索,".doc to ...

  7. python实现生成word文档并转为pdf

    python实现生成word文档,格式转为pdf 使用的是python-docx模块,在生成word文档后转为pdf格式是使用的是docx2pdf中的convert(使用convert转换时,要先创建 ...

  8. 【python自动化办公02】word操作-word转pdf

    点击上方"AI搞事情"关注我们 清明 Python调用Win32com实现Office批量转PDF https://www.cnblogs.com/lolipop2019/p/14 ...

  9. python根据模板生成pdf文件_程序生成word与PDF文档的方法(python)

    程序导出word文档的方法 将web/html内容导出为world文档,再java中有很多解决方案,比如使用Jacob.Apache POI.Java2Word.iText等各种方式,以及使用free ...

最新文章

  1. 使用Xpand XAF创建项目产生Quartz错误的解决方法
  2. Git CMD - show: Show various types of objects
  3. Velodyne收购高清地图公司 将研发更安全的ADAS系统
  4. redisson MultiLock原理及分布式锁的应用
  5. 关于优酷开放SDk之setOnVideoIndexUpdateListener
  6. word java api,是否有可以创建丰富Word文档的Java API?
  7. 台式蓝牙模块_华为第一台台式机来了!已上线官网 定价尚未公布
  8. vivado 启动过程中报错
  9. DeepFake技术--辅助工具
  10. Struts2通配符和动态方法调用
  11. 2500个常用汉字及繁体对应
  12. 39 Spring Boot Shiro权限管理【从零开始学Spring Boot】
  13. 新年祝大家乐一乐,牛年旺旺,发财发财
  14. AM5728 linux内核编译方法
  15. 服务器硬盘选金盘好吗,硬盘怎么选?NAS 盘、监控盘、企业级盘区别?
  16. 北京工商银行业务分析
  17. 【洛谷】P2197 【模板】nim 游戏
  18. 【2013Esri中国用户大会】引人关注的Web开发(部分提供源码下载)
  19. 如果身份认证作为唯一标识码,关联医院和学校会带来什么样的变化
  20. 微信小程序 给input 添加选中样式

热门文章

  1. 浅析为什么char类型的范围是 —128~+127
  2. 开发餐饮点菜PDA设备记录一
  3. 京东获得JD商品详情 API
  4. qsql 关联_PyQt QSqlTableModel 的使用
  5. java专家系统房产营销智能推荐系统计算机毕业设计MyBatis+系统+LW文档+源码+调试部署
  6. 自动控制原理04--根轨迹法
  7. JumpServer RCE漏洞复现
  8. php管理系统申请著作权,php管理系统申请著作权-我有一套PHP源码系统,想修改网站底部版权信息,可......
  9. 微软输入法,中英文输入标点符号无需切换
  10. 直播电商软件开发,js 倒计时编写