wktmltopdf 工具是使用Webkit引擎来将HTML网页转换为PDF文件。其可以将一个URL对应的网页转换为HTML,也可以将存在本地的一个html 文件转换为 pdf 文件。其在应用中有两个优势:1、该软件是开源免费软件;2、该软件支持linux\windows\macos  这些常用的平台。

一、安装

这里以windows为例(本想在 linux 下测试,但在中文时乱码,需要安装对应的中文字库),打开 https://github.com/wkhtmltopdf/wkhtmltopdf/releases/ 地址下载最新版本。直接下一步下一步即可,安装完成后,想在直接CMD下键入命令就可以使用,还需要配置环境变量:

二、测试使用

在CMD命令行下,可以使用如下命令进行测试:

wkhtmltopdf https://www.baidu.com/ D:\baidu.pdf //网络页面

wkhtmltopdf test.html test.pdf //本地HTML页面

# 指定源html编码为utf8,并给转换后的pdf文件加上页眉页脚信息

wkhtmltopdf --encoding utf8 --header-center 访问www.361way.com获取更多信息 --footer-center email至itybku@139.com交流 test.html out.pdf

批量转换

这个是针对单个文件的,我使用python采集了一批html 页面,想全部转换为HTML也很方便,这里使用了下powershell 代码:

Get-ChildItem *.html |ForEach-Object -Process{

$newname=($_.name.Split(".")[0] + '.pdf');

wkhtmltopdf --encoding utf8 --header-center 访问www.361way.com获取更多信息 --footer-center email至itybku@139.com交流 $_.name $newname

}

虽然很快,不过还是吐槽下powershell 语法很烂,和python的可读性相比,差太多了。当时也是有点脑抽,想到使用powershell 实现批量,哈哈!

三、关于乱码问题

出现乱码问题,一般是两种可能:一、是字体库不存在该可用的字体;一种是编码不对。一般后者比较多。字体不在这个就没什么好说的了,安装下字体就行了。看编码不对的问题,可以通过如下两种方法解决:

1、在html 指定编码

我采集下来的html 文件,去掉了很多无用的内容,所以不包含编码信息,这里在第一行加入如下内容:

注意,这里一定要是第一行,我尝试加到后面,发现仍会乱码。

2、指定参数

wkhtmltopdf工具本身,有提供--encoding 参数,在该参数后面,指定对应的编码即可。

html转为pdf工具,wkhtmltopdf html转pdf工具的使用相关推荐

  1. 常用工具实践-HTML转PDF

    文章目录 目标 HTML 转 PDF textpdf类库 代码实践: wkhtmltopdf 软件 代码实践: Chrome Headless 代码实践: 汇总 目标 了解HTML 转PDF一些方式 ...

  2. html转换成pdf工具-wkhtmltopdf、Python生成PDF(pdfkit库)

    文章目录 一.html转换成pdf工具-wkhtmltopdf 1. 什么是wkhtmltopdf 2. 如何使用它? 3. 常见问题 error while loading shared libra ...

  3. 网页转PDF文件工具——wkhtmltopdf

    文章目录 1.下载并安装wkhtmltopdf 2.添加环境变量 3.测试 说明:网页转pdf文件可以使用打印的功能,但是如果页数过多会出现页面不完整的情况,因此找到了一款工具--wkhtmltopd ...

  4. wkhtmltopdf工具简介(HTML转PDF)

    工具 "wkhtmltopdf" 简介 想要了解详情请点击官网 如需直接下载请点击下载页面 wkhtmltopdf并且wkhtmltoimage是开源 (LGPLv3) 命令行工具 ...

  5. HTML 转 PDF 之 wkhtmltopdf

    wkhtmltopdf是一个可以把html转为pdf的插件,有windows.linux等平台的版本,比较简单 官网下载 https://wkhtmltopdf.org/downloads.html  ...

  6. python 怎么将数组转为列表_图片转换成pdf格式怎么操作?什么软件能将图片转为pdf?...

    伙伴们好,你们知道如何把图片转为pdf格式吗?前一阵子我参加了一个家居行业大会,在会议上拍摄了不少会议照片,包括主持人讲话.嘉宾出席.观众提问.产品推广等环节都拍摄了不同的角度.拍摄好后,需要传送给写 ...

  7. django+wkhtmltopdf后端生成pdf

    在写系统时,总是会遇见需要给用户提供pdf下载的功能,pdf生成方式多种多样,有通过前端生成pdf,也有使用后端生成pdf的方式.在这篇文章前已经有写过生成pdf的文章,使用的是php调用wkhtml ...

  8. JPG 转PDF?-- 4种在线免费工具,手机和电脑均适用

    你知道如何将 JPG 转换为 PDF 吗? 在某些情况下,例如学生在填写一些企业的求职网站,求学申请时,通常需要将 JPG 格式的照片转换为 PDF 文件,才能顺利上传. 但是怎么做呢? 是否可以免费 ...

  9. 如何免费创建PDF文档?创建PDF文档的9个工具

    PDF 创建器是一种程序.应用程序或软件,旨在制作或创建 PDF 文档.自可移植文档格式 ( PDF ) 出现以来,文档共享和存储变得更加容易.PDF 还使文件交换更加安全.由于 PDF 格式的众多优 ...

最新文章

  1. Tomcat7.0源码分析——Session管理分析(下)
  2. thinkjs-定时任务
  3. ubuntu16.04 下安装配置python3.6
  4. cocos2d基础介绍
  5. FastDFS 学习笔记
  6. C# Cookie操作类
  7. 颠覆未来世界的十大科技
  8. 小米6线刷包php文件格式,小米6线刷教程 小米6线刷包_救砖包下载
  9. 《三联生活周刊》2017年第26期:3星。终南山隐士现状。
  10. Prophet文档中文翻译--outliers
  11. 设计模式之工厂方法模式(附源码)
  12. 电脑耳机有杂音怎么办?【详解】
  13. APP——功耗测试(耗电测试)——基础知识
  14. 去哪儿网2015年春季校园招聘技术笔试题
  15. 需求分析挑战之旅(疯狂的订餐系统)(5)——领导“突发奇想”
  16. 旗舰级安卓手机推荐 2022年不如买它
  17. python学习之Flask框架(一)
  18. Vue.js 父子组件通信的十种方式;告诉世界前端也能做 AI;你可能不知道的14个JavaScript调试技巧...
  19. 从南宋临安城武林夜市到二维码收款,IoT 语音播报音箱的普及
  20. Python:猜数(number guess)

热门文章

  1. PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组、新增KEGG层级
  2. 微生物入侵:过程、模式与机制
  3. 病从口入:土壤菌群如何影响肠道健康
  4. Nature子刊:华中农大Kenichi Tsuda组利用植物体内原位细菌转录及蛋白组学鉴定寄主免疫攻击的病原菌蛋白...
  5. IDBA-UD:组装非均匀覆盖度的宏基因组和单细胞数据
  6. Basic005. Intro to statistics basic terms统计名词介绍
  7. 宏基因组实战3. MEGAHIT组装拼接及quast评估
  8. R语言ggplot2可视化、不同分组使用不同的色彩、同一分组(group)的线条使用相同的色彩但是配置使用不同的线型(line type)
  9. R语言ggplot2可视化在ggplot2生成的可视化结果下方显示文本:显示一些关于数据的信息
  10. linux的iso镜像机没有redis,在Linux系统上安装Redis【避坑篇】