接上一篇,博主目前所要做的任务,除了要将图片转成pdf外,可能还需要根据爬去站点的内容来合成一篇pdf格式文章,

python中是能够做到这一点的,当然这个前提你要手写html的head,然后将爬取下的内容(注:内容为html样式)作为body的内容。

python中的pdfkit包能够达到这方面的要求,当然前提要下载下来安装好,安装的方法很简单自行百度!

直接上代码:

def content_pdf(item):"""将content内容保存为pdf格式:param content:字符串:return:"""html = '<html><head><meta charset="UTF-8"></head>' \'<body><div align="center"><p>%s</p></div></body></html>' % item['content']path_wk = r'C:\soft\wkhtmltopdf\bin\wkhtmltopdf.exe'  # 安装位置try:out_pdf = file_path(item)config = pdfkit.configuration(wkhtmltopdf=path_wk)pdfkit.from_string(html, out_pdf.format(item['title']), configuration=config)item['download_status'] = 1return itemexcept Exception as e:print(e)

注意:由于爬取内容html的css缺少,所以当前生成的pdf是不美观的。所以说这个就要根据自己的能力来添加样式,达到符合阅读的要求!

python之html网页转PDF相关推荐

  1. 2行代码用 Python「剪藏」网页为 PDF

    不知道你有没有这样的场景,在网页上看到一篇很好的文章,你就很想把它保存下来,并对其中重要的内容进行高亮标记. 这样的工具有很多,像「印象笔记」就可以"剪藏"网页内容到笔记中. 不过 ...

  2. python 网页生成pdf_3个步骤教你如何用Python实现网页转PDF

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:fdy ps:不管你是零基础还是有基础都可以获取到自己相对应的学习礼 ...

  3. Python「剪藏」网页为 PDF

    简介 Python 的第三方库pdfkit ,这个模块可以将网页.html 文件以及字符串生成pdf文件. 把我们想要的网页保存到本地PDF文件,再结合PDF神器(Adobe Acrobat Pro ...

  4. 3个步骤教你如何用Python实现网页转PDF

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:fdy PS:如果你处于想学Python或者正在学习Python,P ...

  5. python批量保存网页内容到PDF

    最近学某人给我提了一个需求,需要批量下载某网站的网页保存PDF中,对于熟悉python的大佬们,应该是一个很简单的任务了,今天想借助这个机会想通过这篇博客给小白们介绍一下如何利用python完成这个简 ...

  6. 强烈推荐这款神器,一行命令将网页转PDF!

    作者 | 派森酱 来源 | Python技术 在日常工作生活中,我们常常会遇到一个需求:将网页保存为PDF. 比如,我比较喜欢某个公众号的文章,为了防止文章被删除,我想把这个公众号的历史文章保存为 P ...

  7. 《我的Python之路V1.3.pdf》可以下载了,这版pdf更精美!

    1 前言 Python之路V1.3.pdf,使用更加专业的latex脚本和专业的Tex Live编译器生成,在经过这周3,4天的学习,编写,制作,终于完成年前制定的计划. 在制作V1.3.pdf中,遇 ...

  8. python爬虫解决网页重定向问题

    python爬虫解决网页重定向问题 参考文章: (1)python爬虫解决网页重定向问题 (2)https://www.cnblogs.com/zhumengke/articles/9618368.h ...

  9. 如何用python创建一个下载网站-用Python下载一个网页保存为本地的HTML文件实例...

    我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库. 比如我们要下载山东大学新闻网的一个页面,该网页如下: 实现代码如下: import urllib.request ...

最新文章

  1. 运行hadoop fs -ls 命令显示本地目录问题
  2. Bash脚本获取自身完整路径的可靠方法
  3. A wizard’s guide to Adversarial Autoencoders: Part 3, Disentanglement of style and content.
  4. video自动全屏播放
  5. python非递归前序遍历二叉树_LintCode66:二叉树的前序遍历(python)
  6. 基于Office 365的随需应变业务应用平台
  7. docker 4 section
  8. 《产品设计与开发(原书第5版)》——3.8 步骤5:选出最佳机会方案
  9. Java File IO
  10. Django案例:显示图书信息
  11. 计蒜客挑战难题:爬楼梯
  12. WPF动画1---基础动画
  13. cursor-spacing 软键盘和input的距离
  14. ReactNative 启动js server报错:Metro Bundler can't listen on port 8081
  15. HDU 4417 Super Mario 主席树
  16. 关注的开源项目-博客搬家工具
  17. 社招简历老被拒?大佬告诉你面试官只中意这些简历,快来看看吧!
  18. golang 使用map处理多级json后输出map中的数组
  19. Java读写json
  20. ac2100 反弹shell无法粘贴_【1029精简稳定版OpenWrt】红米&小米AC2100|帕斯沃|多拨|SmartD...

热门文章

  1. 开鑫金服落实“同心圆”工程 为老年投资人保驾护航
  2. C语言实现二叉平衡树
  3. 数据禾|甘肃省国家湿地公园功能区划数据
  4. C# Parellel.For 和 Parallel.ForEach
  5. C语言拯救者(程序的预处理、编译、链接与宏- -15)
  6. python人脸识别项目_face++与python实现人脸识别签到(考勤)功能
  7. 我对软件应聘学生的建议
  8. VB.net 移动文件夹去另一个地址,删除文件夹里某种类型的文件
  9. 3P(PS、PR、PDF编辑器Acrobat)中的基基本操作(一)
  10. 最新三维立体画·换个角度看世界