【暗恋不可耻但无用】QQ空间爬虫-Python版(pyzone-crawler)
完整原文(含源码):Github
(转载请注明出处,仅供分享学习,严禁用于商业用途)
声明
- 在你心中是否有一个默默关注的小姐姐?
- 你是否想知道在遇见她之前在她身边的一切?
- 确认过眼神,让你总在对的时间遇上对的人
- 写这个插件纯粹是出于学习目的,此博文主要作用是功能展示
- 之后**会围绕这个插件,写一个系列的爬虫教程**
- 请勿使用此软件做不可描述的事情
- 未经允许禁止出于商用目的使用此插件,违者列入授权黑名单并公开示众,所带来的一切后果自负
运行环境
软件介绍
此插件主要用于QQ空间,主要功能包括:
- 模拟QQ登陆
- 爬取目标QQ空间的【相册数据】,根据相册专辑分类,自动下载高清原图、以及图片描述等
- 爬取目标QQ空间的【说说数据】,根据说说页数分类,自动下载高清原图、以及说说内容等
- 自动整理所下载的【相册/说说数据】
运行界面展示
※ 登陆QQ空间
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kcAUgzzl-1578219482733)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/01-%E7%99%BB%E9%99%86QQ%E7%A9%BA%E9%97%B4.png)]
※ 爬取QQ空间相册
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rtMROaoj-1578219482733)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/02-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E7%9B%B8%E5%86%8C.png)]
※ 爬取QQ空间说说
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SnFU3beL-1578219482733)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/03-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E8%AF%B4%E8%AF%B4.png)]
※ 分类整理所下载的图文数据
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v9Iqi7Z2-1578219482734)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/04-%E6%95%B0%E6%8D%AE%E5%AD%98%E5%82%A8%E7%9B%AE%E5%BD%95%E7%BB%93%E6%9E%84.png)]
安装与使用
- 01. 安装Python环境【python-3.5.2-amd64.exe】
- 02. 导入
pyzone-crawler
项目源码并运行 - 03. 根据命令行提示,选择【爬取相册数据】或【爬取说说数据】,即可自动批量下载
图片及其相关信息
- 04. 所下载的数据会自动整理到程序根目录下的
data
文件夹:
○ 不同的QQ空间数据,存储在对应的 [QQ号文件夹] 内
○ [album] 文件夹下保存了目标QQ的每一个相册(非加密相册)的 [相册信息]、[照片]、[照片信息]
○ [mood] 文件夹下保存了目标QQ的所有说说的 [图文信息]
○ [mood/content] 文件夹根据页数保存了该页内所有说说的 [图文信息]
○ [mood/photos] 文件夹汇总了所有说说的图片
注:
此程序需要授权才能使用(防止恶意使用),请加QQ群209442488申请
此程序不包含盗号后门,若不放心请勿使用
此程序不包含破解功能,请确保登陆的QQ号有访问对方QQ空间和相册的权限
升级记录
v1.1版本 (2018-09-15) :
- 01. 修正因QQ空间升级导致xhr协议失效问题
v1.0版本 (2018-05-26) :
- 01. 从Java平台移植
版权声明
- Site: http://exp-blog.com
- Mail: 289065406@qq.com
【暗恋不可耻但无用】QQ空间爬虫-Python版(pyzone-crawler)相关推荐
- QQSpider qq空间爬虫
代码请移步GitHub:QQSpider 爬虫功能: QQSpider 使用广度优先策略爬取QQ空间中的个人信息.日志.说说.好友四个方面的信息,详细可见数据库说明. 判重使用"内存位&q ...
- QQ空间爬虫分享(一天可抓取 400 万条数据)
代码请移步GitHub:QQSpider 爬虫功能: QQSpider 使用广度优先策略爬取QQ空间中的个人信息.日志.说说.好友四个方面的信息,详细可见数据库说明. 判重使用"内存位&qu ...
- qq空间android客户端,手机QQ空间客户端安卓版 v5.2.1 官方正式版
手机QQ空间2012正式版官方免费版让你随时随地分享生活,留住感动. QQ空间(Qzone)是中国最大的社交网络,是QQ用户的移动家园.您可以用手机查看好友动态.与好友互动,上传照片.写说说.写日志. ...
- QQ空间爬虫最新分享,一天 400 万条数据(附代码地址)
前言 本文为作者对其开源项目QQSpider的说明文档.主要替换了程序里一些不可用的链接,对登录时的验证码作了处理,对去重队列作了优化.并且可以非常简单地实现爬虫分布式扩展. Github项目名称:Q ...
- python qq空间_GitHub - miyazawatomoka/Qzone-API: QQ空间的Python接口
QQ空间说说接口 这是一个可以用来访问QQ空间说说详细信息的Python模块,能够为用户解析出有用的信息. 用法 首先要通过传入cookies创建一个Qzone对象,其次调用它的emotion_lis ...
- QQ空间爬虫--获取好友信息
QQ空间网页版:https://user.qzone.qq.com/ 登陆后,进入设置,有一个权限设置,设置"谁能看我的空间"为好友可见,然后构造爬虫. (1)获取Cookie 两 ...
- 自动发qq空间说说python脚本
准备材料: 1.python 2.selenium-3.141.0-py2.py3-none-any python install selenium文件路径 3.geckodriver(用以调用fir ...
- QQ空间触屏版说说模拟评论
http://m.qzone.com/operation/publish_addcomment 头信息: POST /operation/publish_addcomment HTTP/1.1 Hos ...
- 可扩充的爬虫系统(新浪微博爬虫+QQ空间爬虫+全景网爬虫+环球网爬虫+新闻网爬虫)(图片爬虫系统)
源码日后博客分享 需求分析: 背景:机器视觉模型的训练需要大量的图像数据,而互联网上充斥着大量的图像数据,但是并不是所有数据能满足模型数据,这次我们需要满足人脸识别模型的要求,也就是需要大量含有人脸的 ...
- python访问陌生人qq空间_在Python中使用Phantomjs模拟登录QQ空间
一.问题来源 在使用Python进行数据爬取的过程中,我们一般使用Selenuim自动化测试工具对需要进行登录验证和动态JS数据的站点进行爬取.而与Selenuim相对应的浏览器组件,为了方便起见,一 ...
最新文章
- 17、Windows API 图形用户界面(1)
- 计算机硬盘登记表,硬盘固件的 P 表与 G 表
- Python实现 logistic 回归算法
- C# 什么是【事件驱动】
- GPU Gems1 - 3 Dawn Demo中的皮肤渲染(Skin in the Dawn Demo)
- 【H.264/AVC视频编解码技术】第四章【SPS序列参数集】
- Windows 系统中 Python下 Pygame 的安装
- 红旗linux as4,可能是史上最完美的IC5141安装说明档(RHEL-AS4)
- Java Android未捕获异常处理机制
- Python+OpenCV:Canny边缘检测
- mysql如何只查询表中的前几条数据?多表查询前提了解
- 超大文本文件怎么打开(使用Hex Editor)
- 计算机测试的论文,计算机软件测试毕业论文(定稿).doc
- 六轴传感器ICM20602芯片手册学习笔记
- proc sys文件系统对比
- 解决kubernetes启动容器时,容器一直是ContainerCreating不能running
- 虚拟机VM利用U盘重装系统
- Python笔试练习题
- 尝试创建windows XP最长的路径名
- /.bash_profile 到底在哪里 (Macbook)
热门文章
- matlab sqrtm,zz矩阵开方sqrt()和sqrtm()的区别
- 建筑工程计算机的应用,计算机对建筑工程的应用
- Django下载安装及创建项目
- 博途v14电脑要求_博途V14或者V15,大家现在用的电脑-工业支持中心-西门子中国...
- Cosos H5开发工具箱(上)
- 年终工作总结汇报和述职报告ppt模板,内含范文可参考,精选20套可下载
- 数学建模计算机部分知识,数学建模计算机知识的应用
- 怎样背英语单词才高效?
- 用友t3 服务器通讯协议,远程登陆用友t3服务器
- 〖工具〗Ladon 8.4 Cobalt Strike插件发布