完整原文(含源码):Github
(转载请注明出处,仅供分享学习,严禁用于商业用途)


声明

  • 在你心中是否有一个默默关注的小姐姐?
  • 你是否想知道在遇见她之前在她身边的一切?
  • 确认过眼神,让你总在对的时间遇上对的人

  • 写这个插件纯粹是出于学习目的,此博文主要作用是功能展示
  • 之后**会围绕这个插件,写一个系列的爬虫教程**
  • 请勿使用此软件做不可描述的事情
  • 未经允许禁止出于商用目的使用此插件,违者列入授权黑名单并公开示众,所带来的一切后果自负

运行环境


软件介绍

此插件主要用于QQ空间,主要功能包括:

  • 模拟QQ登陆
  • 爬取目标QQ空间的【相册数据】,根据相册专辑分类,自动下载高清原图、以及图片描述等
  • 爬取目标QQ空间的【说说数据】,根据说说页数分类,自动下载高清原图、以及说说内容等
  • 自动整理所下载的【相册/说说数据】
  • 支持两种爬取数据的模式:
      【xhr】 默认模式,用于发布版,爬取速度快,但QQ空间协议经常变动,需定期更新协议避免失效
      【selenium-phantomjs】 仿真模式,仅限开发版,爬取速度慢,但能确保在QQ空间协议变动不大时依然有效

运行界面展示

※ 登陆界面
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XjRbVecJ-1578219531775)(https://raw.githubusercontent.com/lyy289065406/jzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/01-%E7%99%BB%E9%99%86QQ%E7%A9%BA%E9%97%B4.png)]


※ 爬取QQ空间相册
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mzEGnnfQ-1578219531776)(https://raw.githubusercontent.com/lyy289065406/jzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/02-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E7%9B%B8%E5%86%8C.png)]


※ 爬取QQ空间说说
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ApM7u3q9-1578219531776)(https://raw.githubusercontent.com/lyy289065406/jzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/03-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E8%AF%B4%E8%AF%B4.png)]


※ 分类整理所下载的图文数据
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5NeqHtuu-1578219531776)(https://raw.githubusercontent.com/lyy289065406/jzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/04-%E6%95%B0%E6%8D%AE%E5%AD%98%E5%82%A8%E7%9B%AE%E5%BD%95%E7%BB%93%E6%9E%84.png)]


安装与使用

  • 01. 安装JDK环境【jdk-7u72-windows-x64.exe】,一直 下一步 到完成即可(无需修改安装路径)
  • 02. 解压并运行【QQ空间爬虫.exe】
  • 03. 选择【爬取相册数据】或【爬取说说数据】即可自动批量下载 图片及其相关信息
  • 04. 所下载的数据会自动整理到程序根目录下的 data 文件夹:
      ○ 不同的QQ空间数据,存储在对应的 [QQ号文件夹] 内
      ○ [album] 文件夹下保存了目标QQ的每一个相册(非加密相册)的 [相册信息]、[照片]、[照片信息]
      ○ [mood] 文件夹下保存了目标QQ的所有说说的 [图文信息]
      ○ [mood/content] 文件夹根据页数保存了该页内所有说说的 [图文信息]
      ○ [mood/photos] 文件夹汇总了所有说说的图片

注:
 此程序需要授权才能使用(防止恶意使用),请加QQ群209442488申请
 此程序不包含盗号后门,若不放心请勿使用
 此程序不包含破解功能,请确保登陆的QQ号有访问对方QQ空间和相册的权限


升级记录

v2.2版本 (2018-09-15) :

  • 01. 更新软件授权通道为SSL协议
  • 02. 修正因QQ空间升级导致xhr协议失效问题

v2.1版本 (2018-08-06) :

  • 01. 修正软件授权校验接口

v2.0版本 (2018-05-27) :

  • 01. 增加自动升级功能

v1.1版本 (2018-05-26) :

  • 01. 相册爬取
  • 02. 优化相册和说说的爬取模式为XHR
  • 03. 同时支持前后端爬虫
  • 04. 增加软件授权校验

v1.0版本 (2016-06-09) :

  • 01. 支持说说图文爬取

版权声明

  • Site: http://exp-blog.com
  • Mail: 289065406@qq.com

【暗恋不可耻但无用】QQ空间爬虫-Java版(jzone-crawler)相关推荐

  1. QQSpider qq空间爬虫

    代码请移步GitHub:QQSpider 爬虫功能: QQSpider 使用广度优先策略爬取QQ空间中的个人信息.日志.说说.好友四个方面的信息,详细可见数据库说明.  判重使用"内存位&q ...

  2. QQ空间爬虫分享(一天可抓取 400 万条数据)

    代码请移步GitHub:QQSpider 爬虫功能: QQSpider 使用广度优先策略爬取QQ空间中的个人信息.日志.说说.好友四个方面的信息,详细可见数据库说明. 判重使用"内存位&qu ...

  3. qq空间android客户端,手机QQ空间客户端安卓版 v5.2.1 官方正式版

    手机QQ空间2012正式版官方免费版让你随时随地分享生活,留住感动. QQ空间(Qzone)是中国最大的社交网络,是QQ用户的移动家园.您可以用手机查看好友动态.与好友互动,上传照片.写说说.写日志. ...

  4. QQ空间爬虫最新分享,一天 400 万条数据(附代码地址)

    前言 本文为作者对其开源项目QQSpider的说明文档.主要替换了程序里一些不可用的链接,对登录时的验证码作了处理,对去重队列作了优化.并且可以非常简单地实现爬虫分布式扩展. Github项目名称:Q ...

  5. ES GEO地理空间查询java版

    ES GEO地理空间查询java版 一.半径范围查询 1.设置mapping,类型为geo_point PUT /my_locations {"mappings": {" ...

  6. QQ空间爬虫--获取好友信息

    QQ空间网页版:https://user.qzone.qq.com/ 登陆后,进入设置,有一个权限设置,设置"谁能看我的空间"为好友可见,然后构造爬虫. (1)获取Cookie 两 ...

  7. 网站接入QQ互联(JAVA版)

    简介: QQ互联是腾讯旗下的开放平台,通过QQ互联,网站主和开发者可以申请接入QQ登录.用户可以使用QQ账号登录接入的站点,通过添加分享和赞组件,将站点内容分享到QQ空间和朋友网,通过获取API授权, ...

  8. QQ空间触屏版说说模拟评论

    http://m.qzone.com/operation/publish_addcomment 头信息: POST /operation/publish_addcomment HTTP/1.1 Hos ...

  9. 可扩充的爬虫系统(新浪微博爬虫+QQ空间爬虫+全景网爬虫+环球网爬虫+新闻网爬虫)(图片爬虫系统)

    源码日后博客分享 需求分析: 背景:机器视觉模型的训练需要大量的图像数据,而互联网上充斥着大量的图像数据,但是并不是所有数据能满足模型数据,这次我们需要满足人脸识别模型的要求,也就是需要大量含有人脸的 ...

  10. 同步助手 java_八大手机平台全覆盖 QQ同步助手Java版发布

    对Android.symbian.iPhone.WM等智能手机用户而言,通过QQ同步助手软件将通讯录备份到网络,不仅防止丢失,还可便捷的向新购置的手机中导入通讯录.而其实,非智能手机用户也同样的需求, ...

最新文章

  1. C语言基本数据结构之五(折半插入,堆排序,冒泡排序,快速排序,并归排序)
  2. 百度翻译十年:语种全球首破200大关,质量提升30个百分点,每天翻译超千亿字符...
  3. elasticsearch如何安全重启节点
  4. oracle中如何调用存储过程
  5. 产品经理必须知道的一点知识:三种方法判断一个产品该不该做
  6. python常用函数中文_【python】python常用函数
  7. 【Leetcode | 235】 235. 二叉搜索树的最近公共祖先
  8. windows2000 ,windowsXP和windows2003共享页面文件
  9. python中赋值语句_python中赋值语句和增强赋值语句的区别
  10. PyG图神经网络框架torch-geometric安装
  11. 浏览器打不开python的页面_robotframework,selenium启动不了打不开浏览器的问题访问不了网页...
  12. merge合并两个有序数组
  13. esx4克隆后的处理工作
  14. 二、optimizer_trace基本使用
  15. 利用二层端口安全防止两个三层交换机长距离光纤线路被乱接测试
  16. python怎么把小写改成大写_Python 把金额小写转换成大写
  17. 悉尼科技大学量子计算_世界排名前12位的量子计算研究型大学
  18. 帕丽斯·希尔顿,缺少
  19. 推荐用于环境识别的机器人摄像头
  20. linux禁止root用户su,Linux 禁止普通用户su到root

热门文章

  1. php 转换中文乱码,解决php中文乱码转换问题
  2. 【iOS】下的读写锁的简单实现
  3. 计算思维与创新创业 课程 获批
  4. 计算机大学生职业规划书word模板,大学生职业规划书范文word模板
  5. 解压版tomcat安装配置
  6. 2021年12月中国各省市认证证书数量排行榜:Top前四的省份证书数累计占全国比重超过50%(附月榜TOP34详单)
  7. 【办公自动化】基于Arcpy建立GIS三调转换工具箱,23万图斑shp文件分分钟转换完成
  8. 南航计算机学院院长黄志球简历,南航计算机科学与技术学院导师介绍:沈国华...
  9. 【跨年烟花代码】用C语言来写“烟花”,快拿去给心中的那个人看
  10. JSbridge原理与实现简析