多种文档下载器

本工具适用于下载豆丁、道客巴巴、淘豆网、原创力、新浪爱问、金锄头网站的可以预览的文档。只要可以预览,就可以下载。下载下来是图片格式,然后会通过reportlab库,将图片转换成PDF。

其中,由于新浪爱问网站用的都是svg格式的文件,将其转换成图片格式需要调用第三方库。Windows下可用svg2png库,Linux下可使用rsvg库。当然,在windows上面也可以安装rsvg库,需要下载CRAN,利用CRAN安装rsvg,实现svg的转换。

本项目还提供了一个简易的在线下载网页,[点击进入]

rsvg库安装方法

Binary packages for OS-X or Windows can be installed directly from CRAN:

install.packages("rsvg")

Installation from source on Linux or OSX requires librsvg2. On Debian or Ubuntu install librsvg2-dev:

sudo apt-get install -y librsvg2-dev

On Fedora, CentOS or RHEL we need librsvg2-devel:

sudo yum install librsvg2-devel

On OS-X use rsvg from Homebrew:

brew install librsvg

svg2png安装方法(仅限Windows操作系统)

1. 安装nodejs

2. 命令提示符内输入:npm install -g svg2png

3. 命令提示符内输入:Set-ExecutionPolicy -ExecutionPolicy

本项目使用方法

终端内输入:

pip install -r requirements.txt

python docDownloader.py

若使用报错,应先检查chromedriver版本与chrome版本是否兼容。若不兼容,则只需将项目中的chromedriver.exe替换为兼容的版本即可。

python下载豆丁文档_doc_downloader相关推荐

  1. python下载付费文档教程-付费?是不可能的!处理 PDF 只需几行代码,彻底解放双手!...

    在日常工作中,PDF (Portable Document Format的简称,意为"可携带文档格式") 是我们比较常用的电子文档格式.PDF文件以 PostScript 语言图象 ...

  2. python爬虫系列之下载在线文档Excel(腾讯)

    python爬虫系列之腾讯文档Excel数据 一.简介 二.实现步骤 1. 数据准备 2. 获取当前用户nowUserIndex 3.创建导出任务 4. 检查数据准备进度,并下载 三.完整代码 四.效 ...

  3. python+django 实现从服务器下载pdf文档的功能

    使用python+django框架写了http接口测试平台,需要给用户一个使用文档,于是我开始绘制前端的页面,用的react,如下图,样式我还是很满意的 写完了前端开始写后端了,后端应的python+ ...

  4. 抱米花-豆丁文档下载器 docin20090818

    http://soly84.blog.51cto.com/153780/198568 豆丁文档下载器 简介 豆丁下载器,可以用来下载国内最大的"资料集散市场"豆丁上的各类电子文档, ...

  5. 推荐一个免费下载神器!你还在付费下载百度文库、豆丁文档吗?

    推荐一个很厉害的神器:冰点文库助手.它可以免费下载百度文库.豆丁文档.道客巴巴等各种网站几亿份文档!!!甚至大部分付费文档都可以下载!逆天了有没有!电脑下载,把需要下载的文档网址复制到软件的输入框即可 ...

  6. PyQt(Python+Qt)帮助文档官网及文档下载

    一.帮助文档下载 老猿在网上找到一个Qt 5.9的帮助文档,没有找到最新版的,并且这个文档官网上没有下载,不知道源头在哪里可以下载. 文档存放在百度网盘: 链接:https://pan.baidu.c ...

  7. Python工程的文档结构

    Python工程的文档结构,可以参考https://stackoverflow.com/questions/193161/what-is-the-best-project-structure-for- ...

  8. 查看本机中的python第三方库文档

    [转载] 原文链接:https://blog.csdn.net/weixin_43936250/article/details/105251049 本机系统为win10,在使用python编程的过程中 ...

  9. 用python处理excel-使用Python操作Excel文档(一)

    Python | 使用Python操作Excel文档(一) 0 前言 在阅读本文之前,请确保您已满足或可能满足以下条件: 请确保您具备基本的Python编程能力. 请确保您会使用Excel. 请确保您 ...

  10. 【PC工具】更新免费文库文档下载器,免费下载文库文档

        之前分享的大圣文库开始收费了(WC),今天更新一个更简单的方法,不用下载安装软件,直接在豆丁文库域名后增加365即可,百度文库不行,百度文库域名加vvv的方法我今天(191218)测试已经不好 ...

最新文章

  1. Java进阶之深入理解JVM类加载机制
  2. IIR+双向滤波实现系统零相位相移_MATLAB仿真
  3. 【Xamarin挖墙脚系列:Android最重要的命令工具ADB】
  4. 【jQuery笔记Part1】06-jQuery对象与js对象转换
  5. 【转】移动前端工作的那些事---UE/UI架构原型搭建和前端设计之UE架构原型搭建...
  6. 医疗卫生行业涉及的信息数据元属性与值域代码(数据集)
  7. c语言课程设计日程表,日程表:schedule用法大全
  8. 大龄程序员的8种出路
  9. 天池宫颈癌智能诊断赛后总结——目标检测
  10. 以下程序从读入的整数数据中,统计大于零的整数个数和小于零的整数个数。用输入零来结束输入,程序中用i统计大于零的个数,用变量j统计小于零的整数。
  11. [软件工程 复习] 记录
  12. 英语基础知识:句子类型
  13. 阿里云培训-AS(弹性伸缩)
  14. word2016中公式不能用斜体的解决方法
  15. 绿色便携版杀毒软件Clamwin也能自动作业
  16. 用python编程小程序制作_Python编写四人24小时值班表生成小程序【简单粗暴】
  17. Vue 通过url下载文件并对下载的文件更名
  18. aarch64处理器下载哪个mysql_AArch64架构安装JDK
  19. 嵌入式:ARM常用开发编译软件介绍
  20. 来自Jdon的DDD总结

热门文章

  1. 三维重建-摄像机模型+摄像机标定(上)
  2. JavaScript---去除字符串中的空格(五种方式,总有一种适合你)
  3. ubuntu管理开机启动项
  4. Kali学习 | 权限提升:5.3 社工SET_启动
  5. 啊哈算法---快速排序(C语言)
  6. 麦子学院深度学习进阶课程题目纲要
  7. 最后一周——数模美赛赛前准备总结
  8. 第九章 JSP标签——《跟我学Shiro》[张开涛]
  9. 一文讲清楚ojdbc、Oracle和JDK之间的兼容性关系
  10. 山科大离散数学期末考试_离散数学期末考试含答案