自己用JAVA做的CSDN博文下载器,提供jar包和源码。

源码也公开吧,反正jar反编译也能得到源码,新手不会jar加密。

下载:http://download.csdn.net/detail/owuguanfengyue123/8619649

资源csdn在审核吧...好慢

考虑到上课的时候看博客不方便,想把好的博客全部下载下来,在手机上看。

各种百度,找到了几个工具。

1.http://blog.csdn.net/gzshun/article/details/7555525

大神写了思路和教程,用他的工具发现的问题:

(1)下载不完全,测试只能下载第一页的21篇文章左右。

(2)生成的pdf看着还行,代码部分有的超出pdf页面范围,导致看不到,不方便

2.http://www.cr173.com/soft/48129.html

这个大神写的通用博客导出工具,好像接口有变化,失效了,导出不了。

我就在琢磨自己写个程序出来。

好了,有了http://blog.csdn.net/gzshun/article/category/932960 前辈的思路。

扩展了一下,自己的思路:

(1)电脑版改为手机版

个人感觉手机版csdn更精简,处理起来肯定方便,链接是http://m.blog.csdn.net/blog,后面加用户名就是该用户的博客了,这里要区别用户名和自定义域名,电脑版的博客链接一般是自定义域名,例如:我的电脑版csdn博客自定义域名是:noaboutfengyue,我的用户名是:oWuGuanFengYue123,电脑版中http://blog.csdn.net/加这两个都可以跳转到博客,但是在手机版中只能访问 http://m.blog.csdn.net/blog/oWuGuanFengYue123打开博客。

为了使用方便,程序只需读入自定义域名就能下载,所以,增加个方法,功能是通过域名获得用户名,实现很简单,打开http://blog.csdn.net/noaboutfengyue,源码中就有oWuGuanFengYue123用户名,通过正则表达式解析就Ok。

(2)采用ITEXT从html生产pdf

在http://blog.csdn.net/noaboutfengyue/article/details/45174787中已经说明

(3)获取所有文章列表

经测试发现http://m.blog.csdn.net/blog/oWuGuanFengYue123?page= 这个page是文章页数,当这个数字很大时,大过文章页数,取个极限,99999,http://m.blog.csdn.net/blog/oWuGuanFengYue123?page=999999,显示的就是所有文章

(4)文章列表的获取和文章内容的解析

在(3)中获取的页面,通过正则表达式,解析出所有文章标题和url,然后通过这个url得到html源码,由于使用IText,对html源码的格式要求很严,所以这里要进行预处理(这里做的有点不完善),比如<br>报错,必须改成<br/>,还有一些,然后直接转换成pdf输出。

(5)增加序号

为了使生成出来的pdf有序,按照作者第一篇博文开始编号。生成出来的文件名是  1.标题.pdf

思路大概就这些,细节方面有些要处理。

使用说明:

下载目录在当前程序目录/csdn/用户名

演示一下吧。

用http://m.blog.csdn.net/blog/lmj623565791 这个老师的来演示,博客写得很好。

处理过程显示:

还是有些地方处理的不完善,大致上处理还不错,能生成大部分pdf。

结果:

就这样了,哈哈,世界清净了。

不说了,我去下载好的博客去了,上课了去看。

复制去Google翻译翻译结果

CSDN博文下载器(JAVA)相关推荐

  1. 小说搜索+批量下载器(java版)

    截图:

  2. java 多线程下载器_Java多线程的下载器(1)

    实现了一个基于Java多线程的下载器,可提供的功能有: 1. 对文件使用多线程下载,并显示每时刻的下载速度. 2. 对多个下载进行管理,包括线程调度,内存管理等. 一:单个文件下载的管理 1. 单文件 ...

  3. java爬虫写一个百度图片下载器

    文章目录 img_download 1.0 看看效果吧 2.0 了解一下 "图片下载器软件" 目录结构 3.0 如何使用? 4.0 源码剖析 5.0 项目地址 6.0 写在最后的话 ...

  4. 用python实现csdn博主全部博文下载,html转pdf,有了学习的电子书了。。。(附源码)

    用python实现csdn博主全部博文下载,html转pdf,有了学习的电子书了...(附源码) 我们学习编程,在学习的时候,会有想把有用的知识点保存下来,我们可以把知识点的内容爬下来转变成pdf格式 ...

  5. python3制作下载器_Python制作CSDN免积分下载器

    复制代码 代码如下: #-*-coding:utf-8-*- #python3.3.5 import urllib.parse,urllib.request,http.cookiejar,io,web ...

  6. 地图下载器工具-Java

    地图下载器工具-Java 瓦片下载 要点1 使用瓦片的访问地址直接下载瓦片 主要用到的是HttpURLConnection去访问,为了避免被封杀ip,设置了两个请求参数referer,User-Age ...

  7. JAVA多线程下载器

    大二末了,选好了方向,而去也喜欢网络并发,多线程之类的,就决定做个多线程下载器,学习学习文件,网络,线程间通讯的方法. 代码其实早就开始写,只是一直比较忙,也没写多少.今天认真花了一天把下载线程写了. ...

  8. 页面下载器(我的Java爬虫之一)

    说点别的 maven打包 官方定制的打包方式 使用maven assembly plugin插件完成打包操作,插件配置在pom.xml文件的build标签中,格式如下. <build>[. ...

  9. java实现下载器(2)

    上一篇文章里面,使用Java的connection和url类库实现了多线程下载文件的一个demo,这次我根据之前的思路设计了一下下载器程序的接口,如下图 这里我根据所下载的文件协议不同分成了http下 ...

  10. 用Java写一个电影自动下载器

    你好! 下面是一些步骤来帮助你写一个电影自动下载器: 建立一个新的Java项目 选择一个电影下载网站作为数据源, 并使用网络爬虫或API来获取电影的信息(如标题, 时长, 格式, 大小等) 使用Jav ...

最新文章

  1. ExtJS实现完美Grid(2)--分组统计
  2. RPC实现Consumer 远程调用
  3. Hive中JOIN的使用入门
  4. python集合应用场景_python 集合的应用
  5. android梅花形布局,Android相对布局实现各种梅花效果
  6. jsp基础代码片段(含sql与js和jsp的交互)与简易贴吧网站项目
  7. 运维测试工作笔记0002---网站访问的UV,IP,PV,VV是什么意思
  8. 小程序页面启动过程分析
  9. c语言第十章课后作业答案,C语言练习题第十章
  10. 力士乐驱动器原理图_力士乐驱动器参考手册大全
  11. MVS同时读取多个二维码
  12. java blazeds_Flex+Java+Blazeds
  13. Spring获取外网IP
  14. syntax error:unterminated quoted string
  15. 导出datatable到excel然后让web客户端下载到本地
  16. 显示器怎么看服务器内容,电脑显示器知识扫盲 教你怎么看显示器参数
  17. java 获取百度云盘图片_java 利用百度云识别图片文字
  18. CentOS 7 从下载到安装
  19. php实现mkv视频播放,mkv文件用什么软件打开
  20. 你知道工作站和服务器有什么区别吗?科普必看

热门文章

  1. 篮球计分器软件_SPSS 26 综合性数学统计分析工具
  2. kafka消费者如何读同一生产者消息_kafka学习笔记
  3. python的输入来源包括啥_Python中使用 input 函数来获取输入
  4. 计算机0表示负数,计算机原码反码补码_0
  5. centos7网络配置总结
  6. GoogLeNet 之 Inception v1 v2 v3 v4
  7. [机器学习实战] 基于概率论的分类方法:朴素贝叶斯
  8. uva live 4394 String painter 区间dp
  9. C语言,使用结构体读入两个在同一年的日期,判断日期是否合法,并计算两个日期之间相差的天数。结构体定义如下:...
  10. javascript---继承