python下载豆丁文档_doc_downloader
多种文档下载器
本工具适用于下载豆丁、道客巴巴、淘豆网、原创力、新浪爱问、金锄头网站的可以预览的文档。只要可以预览,就可以下载。下载下来是图片格式,然后会通过reportlab库,将图片转换成PDF。
其中,由于新浪爱问网站用的都是svg格式的文件,将其转换成图片格式需要调用第三方库。Windows下可用svg2png库,Linux下可使用rsvg库。当然,在windows上面也可以安装rsvg库,需要下载CRAN,利用CRAN安装rsvg,实现svg的转换。
本项目还提供了一个简易的在线下载网页,[点击进入]
rsvg库安装方法
Binary packages for OS-X or Windows can be installed directly from CRAN:
install.packages("rsvg")
Installation from source on Linux or OSX requires librsvg2. On Debian or Ubuntu install librsvg2-dev:
sudo apt-get install -y librsvg2-dev
On Fedora, CentOS or RHEL we need librsvg2-devel:
sudo yum install librsvg2-devel
On OS-X use rsvg from Homebrew:
brew install librsvg
svg2png安装方法(仅限Windows操作系统)
1. 安装nodejs
2. 命令提示符内输入:npm install -g svg2png
3. 命令提示符内输入:Set-ExecutionPolicy -ExecutionPolicy
本项目使用方法
终端内输入:
pip install -r requirements.txt
python docDownloader.py
若使用报错,应先检查chromedriver版本与chrome版本是否兼容。若不兼容,则只需将项目中的chromedriver.exe替换为兼容的版本即可。
python下载豆丁文档_doc_downloader相关推荐
- python下载付费文档教程-付费?是不可能的!处理 PDF 只需几行代码,彻底解放双手!...
在日常工作中,PDF (Portable Document Format的简称,意为"可携带文档格式") 是我们比较常用的电子文档格式.PDF文件以 PostScript 语言图象 ...
- python爬虫系列之下载在线文档Excel(腾讯)
python爬虫系列之腾讯文档Excel数据 一.简介 二.实现步骤 1. 数据准备 2. 获取当前用户nowUserIndex 3.创建导出任务 4. 检查数据准备进度,并下载 三.完整代码 四.效 ...
- python+django 实现从服务器下载pdf文档的功能
使用python+django框架写了http接口测试平台,需要给用户一个使用文档,于是我开始绘制前端的页面,用的react,如下图,样式我还是很满意的 写完了前端开始写后端了,后端应的python+ ...
- 抱米花-豆丁文档下载器 docin20090818
http://soly84.blog.51cto.com/153780/198568 豆丁文档下载器 简介 豆丁下载器,可以用来下载国内最大的"资料集散市场"豆丁上的各类电子文档, ...
- 推荐一个免费下载神器!你还在付费下载百度文库、豆丁文档吗?
推荐一个很厉害的神器:冰点文库助手.它可以免费下载百度文库.豆丁文档.道客巴巴等各种网站几亿份文档!!!甚至大部分付费文档都可以下载!逆天了有没有!电脑下载,把需要下载的文档网址复制到软件的输入框即可 ...
- PyQt(Python+Qt)帮助文档官网及文档下载
一.帮助文档下载 老猿在网上找到一个Qt 5.9的帮助文档,没有找到最新版的,并且这个文档官网上没有下载,不知道源头在哪里可以下载. 文档存放在百度网盘: 链接:https://pan.baidu.c ...
- Python工程的文档结构
Python工程的文档结构,可以参考https://stackoverflow.com/questions/193161/what-is-the-best-project-structure-for- ...
- 查看本机中的python第三方库文档
[转载] 原文链接:https://blog.csdn.net/weixin_43936250/article/details/105251049 本机系统为win10,在使用python编程的过程中 ...
- 用python处理excel-使用Python操作Excel文档(一)
Python | 使用Python操作Excel文档(一) 0 前言 在阅读本文之前,请确保您已满足或可能满足以下条件: 请确保您具备基本的Python编程能力. 请确保您会使用Excel. 请确保您 ...
- 【PC工具】更新免费文库文档下载器,免费下载文库文档
之前分享的大圣文库开始收费了(WC),今天更新一个更简单的方法,不用下载安装软件,直接在豆丁文库域名后增加365即可,百度文库不行,百度文库域名加vvv的方法我今天(191218)测试已经不好 ...
最新文章
- Java进阶之深入理解JVM类加载机制
- IIR+双向滤波实现系统零相位相移_MATLAB仿真
- 【Xamarin挖墙脚系列:Android最重要的命令工具ADB】
- 【jQuery笔记Part1】06-jQuery对象与js对象转换
- 【转】移动前端工作的那些事---UE/UI架构原型搭建和前端设计之UE架构原型搭建...
- 医疗卫生行业涉及的信息数据元属性与值域代码(数据集)
- c语言课程设计日程表,日程表:schedule用法大全
- 大龄程序员的8种出路
- 天池宫颈癌智能诊断赛后总结——目标检测
- 以下程序从读入的整数数据中,统计大于零的整数个数和小于零的整数个数。用输入零来结束输入,程序中用i统计大于零的个数,用变量j统计小于零的整数。
- [软件工程 复习] 记录
- 英语基础知识:句子类型
- 阿里云培训-AS(弹性伸缩)
- word2016中公式不能用斜体的解决方法
- 绿色便携版杀毒软件Clamwin也能自动作业
- 用python编程小程序制作_Python编写四人24小时值班表生成小程序【简单粗暴】
- Vue 通过url下载文件并对下载的文件更名
- aarch64处理器下载哪个mysql_AArch64架构安装JDK
- 嵌入式:ARM常用开发编译软件介绍
- 来自Jdon的DDD总结