完整原文(含源码):Github
(转载请注明出处,仅供分享学习,严禁用于商业用途)


声明

  • 在你心中是否有一个默默关注的小姐姐?
  • 你是否想知道在遇见她之前在她身边的一切?
  • 确认过眼神,让你总在对的时间遇上对的人

  • 写这个插件纯粹是出于学习目的,此博文主要作用是功能展示
  • 之后**会围绕这个插件,写一个系列的爬虫教程**
  • 请勿使用此软件做不可描述的事情
  • 未经允许禁止出于商用目的使用此插件,违者列入授权黑名单并公开示众,所带来的一切后果自负

运行环境


软件介绍

此插件主要用于QQ空间,主要功能包括:

  • 模拟QQ登陆
  • 爬取目标QQ空间的【相册数据】,根据相册专辑分类,自动下载高清原图、以及图片描述等
  • 爬取目标QQ空间的【说说数据】,根据说说页数分类,自动下载高清原图、以及说说内容等
  • 自动整理所下载的【相册/说说数据】

运行界面展示

※ 登陆QQ空间
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kcAUgzzl-1578219482733)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/01-%E7%99%BB%E9%99%86QQ%E7%A9%BA%E9%97%B4.png)]


※ 爬取QQ空间相册
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rtMROaoj-1578219482733)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/02-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E7%9B%B8%E5%86%8C.png)]


※ 爬取QQ空间说说
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SnFU3beL-1578219482733)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/03-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E8%AF%B4%E8%AF%B4.png)]


※ 分类整理所下载的图文数据
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v9Iqi7Z2-1578219482734)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/04-%E6%95%B0%E6%8D%AE%E5%AD%98%E5%82%A8%E7%9B%AE%E5%BD%95%E7%BB%93%E6%9E%84.png)]


安装与使用

  • 01. 安装Python环境【python-3.5.2-amd64.exe】
  • 02. 导入pyzone-crawler项目源码并运行
  • 03. 根据命令行提示,选择【爬取相册数据】或【爬取说说数据】,即可自动批量下载 图片及其相关信息
  • 04. 所下载的数据会自动整理到程序根目录下的 data 文件夹:
      ○ 不同的QQ空间数据,存储在对应的 [QQ号文件夹] 内
      ○ [album] 文件夹下保存了目标QQ的每一个相册(非加密相册)的 [相册信息]、[照片]、[照片信息]
      ○ [mood] 文件夹下保存了目标QQ的所有说说的 [图文信息]
      ○ [mood/content] 文件夹根据页数保存了该页内所有说说的 [图文信息]
      ○ [mood/photos] 文件夹汇总了所有说说的图片

注:
 此程序需要授权才能使用(防止恶意使用),请加QQ群209442488申请
 此程序不包含盗号后门,若不放心请勿使用
 此程序不包含破解功能,请确保登陆的QQ号有访问对方QQ空间和相册的权限


升级记录

v1.1版本 (2018-09-15) :

  • 01. 修正因QQ空间升级导致xhr协议失效问题

v1.0版本 (2018-05-26) :

  • 01. 从Java平台移植

版权声明

  • Site: http://exp-blog.com
  • Mail: 289065406@qq.com

【暗恋不可耻但无用】QQ空间爬虫-Python版(pyzone-crawler)相关推荐

  1. QQSpider qq空间爬虫

    代码请移步GitHub:QQSpider 爬虫功能: QQSpider 使用广度优先策略爬取QQ空间中的个人信息.日志.说说.好友四个方面的信息,详细可见数据库说明.  判重使用"内存位&q ...

  2. QQ空间爬虫分享(一天可抓取 400 万条数据)

    代码请移步GitHub:QQSpider 爬虫功能: QQSpider 使用广度优先策略爬取QQ空间中的个人信息.日志.说说.好友四个方面的信息,详细可见数据库说明. 判重使用"内存位&qu ...

  3. qq空间android客户端,手机QQ空间客户端安卓版 v5.2.1 官方正式版

    手机QQ空间2012正式版官方免费版让你随时随地分享生活,留住感动. QQ空间(Qzone)是中国最大的社交网络,是QQ用户的移动家园.您可以用手机查看好友动态.与好友互动,上传照片.写说说.写日志. ...

  4. QQ空间爬虫最新分享,一天 400 万条数据(附代码地址)

    前言 本文为作者对其开源项目QQSpider的说明文档.主要替换了程序里一些不可用的链接,对登录时的验证码作了处理,对去重队列作了优化.并且可以非常简单地实现爬虫分布式扩展. Github项目名称:Q ...

  5. python qq空间_GitHub - miyazawatomoka/Qzone-API: QQ空间的Python接口

    QQ空间说说接口 这是一个可以用来访问QQ空间说说详细信息的Python模块,能够为用户解析出有用的信息. 用法 首先要通过传入cookies创建一个Qzone对象,其次调用它的emotion_lis ...

  6. QQ空间爬虫--获取好友信息

    QQ空间网页版:https://user.qzone.qq.com/ 登陆后,进入设置,有一个权限设置,设置"谁能看我的空间"为好友可见,然后构造爬虫. (1)获取Cookie 两 ...

  7. 自动发qq空间说说python脚本

    准备材料: 1.python 2.selenium-3.141.0-py2.py3-none-any python install selenium文件路径 3.geckodriver(用以调用fir ...

  8. QQ空间触屏版说说模拟评论

    http://m.qzone.com/operation/publish_addcomment 头信息: POST /operation/publish_addcomment HTTP/1.1 Hos ...

  9. 可扩充的爬虫系统(新浪微博爬虫+QQ空间爬虫+全景网爬虫+环球网爬虫+新闻网爬虫)(图片爬虫系统)

    源码日后博客分享 需求分析: 背景:机器视觉模型的训练需要大量的图像数据,而互联网上充斥着大量的图像数据,但是并不是所有数据能满足模型数据,这次我们需要满足人脸识别模型的要求,也就是需要大量含有人脸的 ...

  10. python访问陌生人qq空间_在Python中使用Phantomjs模拟登录QQ空间

    一.问题来源 在使用Python进行数据爬取的过程中,我们一般使用Selenuim自动化测试工具对需要进行登录验证和动态JS数据的站点进行爬取.而与Selenuim相对应的浏览器组件,为了方便起见,一 ...

最新文章

  1. 17、Windows API 图形用户界面(1)
  2. 计算机硬盘登记表,硬盘固件的 P 表与 G 表
  3. Python实现 logistic 回归算法
  4. C# 什么是【事件驱动】
  5. GPU Gems1 - 3 Dawn Demo中的皮肤渲染(Skin in the Dawn Demo)
  6. 【H.264/AVC视频编解码技术】第四章【SPS序列参数集】
  7. Windows 系统中 Python下 Pygame 的安装
  8. 红旗linux as4,可能是史上最完美的IC5141安装说明档(RHEL-AS4)
  9. Java Android未捕获异常处理机制
  10. Python+OpenCV:Canny边缘检测
  11. mysql如何只查询表中的前几条数据?多表查询前提了解
  12. 超大文本文件怎么打开(使用Hex Editor)
  13. 计算机测试的论文,计算机软件测试毕业论文(定稿).doc
  14. 六轴传感器ICM20602芯片手册学习笔记
  15. proc sys文件系统对比
  16. 解决kubernetes启动容器时,容器一直是ContainerCreating不能running
  17. 虚拟机VM利用U盘重装系统
  18. Python笔试练习题
  19. 尝试创建windows XP最长的路径名
  20. /.bash_profile 到底在哪里 (Macbook)

热门文章

  1. matlab sqrtm,zz矩阵开方sqrt()和sqrtm()的区别
  2. 建筑工程计算机的应用,计算机对建筑工程的应用
  3. Django下载安装及创建项目
  4. 博途v14电脑要求_博途V14或者V15,大家现在用的电脑-工业支持中心-西门子中国...
  5. Cosos H5开发工具箱(上)
  6. 年终工作总结汇报和述职报告ppt模板,内含范文可参考,精选20套可下载
  7. 数学建模计算机部分知识,数学建模计算机知识的应用
  8. 怎样背英语单词才高效?
  9. 用友t3 服务器通讯协议,远程登陆用友t3服务器
  10. 〖工具〗Ladon 8.4 Cobalt Strike插件发布