第0.8期-xiaspider2021目录索引
瞎老弟的联系方式
qq群:383472162
目录索引
第0期-xiaspider2021计划及介绍
第0.5期-xiaspider2021模组先导篇
第1期-通过携程获取机票价格
第2期-通过去哪儿获取机票价格
第3期-通过途牛获取机票价格
第4期-通过起点获取小说
第5期-通过飞卢小说获取小说
第6期-通过qq阅读获取小说
第7期-通过潇湘书院获取小说
第8期-通过晋江获取小说
第9期-通过简书获取文章
第10期-通过yy直播获取封面图
第11期-通过斗鱼直播获取弹幕
第12期-通过百度贴吧获取帖子
第13期-爬取新闻是违法违规的以下架
第14期-爬取新闻是违法违规的以下架
第15期-通过新浪体育爬取赛程
第16期-通过搜狐体育爬取赛程
网站反爬手段总结
注意:分析中不包括根据访问速度,访问次数,访问频率等可以通过多账号或代理ip绕过的行为检测
第1期-携程:js加密
第2期-去哪儿:js加密,selenium检测,css加密
第3期-途牛:js加密,账号登录
第4期-起点:账号登录(vip付费章节)
第5期-飞卢:账号登录(vip付费章节)
第6期-qq阅读:ajax请求(不算是反爬,但是有人会找不到接口)
第7期-潇湘书院:字体加密(渲染无效)
第8期-晋江:二类字体加密(渲染有效)
第9期-简书:user-agent检测
第10期-yy直播:/
第11期-斗鱼直播:/
第12期-百度贴吧:/
第13期-新闻:因违法违规被暂停
第14期-新闻:因违法违规被暂停
第15期-新浪体育:/
第16期-搜狐体育:基于用于行为反爬
里程碑
1,第一次出现js加密:携程机票
2,第一次出现css加密:去哪儿机票
3,第一次出现selenium检测:去哪儿机票
4,第一次出现强制登录账号:途牛机票
5,第一次出现字体加密:潇湘书院
6,第一次出现二类字体加密:晋江文学城
7,第一次出现user-agent检测:简书
8,第一次出现用户行为检测:搜狐体育
解释
有的时候,不仅没有给出接口地址,甚至没有给出网站地址,这是为什么,是不是糊弄人?
这个确实我也没办法,因为之前我每次都会写清楚地址,结果是会因为版权问题无法过审,修改4,5次也仍然无法通过审核,最后还得把已经写了的所有这部分的内容都删掉。这我也没办法,毕竟普通的爬虫虽然应当不是违法行为,但是毕竟也不算光明磊落的事情。像14-15期这种,我甚至在文章中只是提及了一下爬取的方法,都会被判定为违反法规。因此,现在尽量都是低调行事,不再提及网站的地址和接口了。所以说,带来影响,确实很抱歉,但我么得办法。如果你需要这部分的内容,包括代码,可以按照我给出的联系方式来和我进行联系。
第0.8期-xiaspider2021目录索引相关推荐
- PHP设置禁止目录索引,/var/www/html目录索引禁止
我正在使用以下文件复制在 /etc/nginx/conf.d/default.conf server { listen 80; root /var/www/html/public; index ind ...
- SQL Server 2008/2012中SQL应用系列及BI学习笔记系列--目录索引
SQL Server 2008中的一些特性总结及BI学习笔记系列,欢迎与邀月交流. 3w@live.cn ◆0.SQL应用系列 1.SQL Server 2008中SQL增强之一:Values新用途 ...
- onedrive目录PHP源码,另一个OneDrive目录索引应用 OLAINDEX
OLAINDEX ✨ Another OneDrive Directory Index. 此图来自 如有乐享,感谢推广 本项目受 Oneindex 启发,功能借鉴其思想,在这里感谢. 项目持续开发,会 ...
- r语言默认工作目录document_使用 Docker 和 Nginx 实现简单目录索引服务
本文将会介绍如何使用 Docker.Node.JavaScript.Traefik 完成一个简单的目录索引服务,全部代码在 300 行以内.相关代码已开源至 GitHub ,文末有链接,感兴趣可以自取 ...
- 反骨仔的 2016 年度全文目录索引
反骨仔的 2016 年度全文目录索引 序 这是博主去年所发文章的目录汇总,虽然含金量不高,即便技术不高,但始终勇于献丑,敢于弄斧到班门. [备注]推荐:表示推荐数 ≥ 50,非自荐:强烈推荐:表示推荐 ...
- phpstudy nginx 目录索引失败 404 Not Found 的原因
解决方法: 打开站点的 nginx 配置文件(一般在 nginx 目录的 conf/vhosts 下面), 把默认文档 index index.php index.html error/index.h ...
- php空间搭建tcshare,TCshare:天翼云盘API目录索引列表程序 新手注意事项及composer install出错处理...
天翼云盘(原名天翼云)是中国电信面向个人用户推出的云服务产品,提供"极速安全"云端存储及分享服务. 天翼云盘凭手机号码登录使用,支持电信.联通.移动手机号码,覆盖WEB.PC客户端 ...
- SQL Server 2008中SQL应用系列及BI学习笔记系列--目录索引 @邀月
邀月 的数据库学习 http://www.cnblogs.com/downmoon/archive/2011/03/10/1980172.html SQL Server 2008中SQL应用系列及BI ...
- 【.NET Core项目实战-统一认证平台】开篇及目录索引
[.NET Core项目实战-统一认证平台]开篇及目录索引 一.如何添加客户端授权? 在了解如何进行客户端授权时,我们需要了解详细的授权流程,在[.NET Core项目实战-统一认证平台]第八章 授权 ...
最新文章
- java——逻辑运算符与(和)或(|和||)
- bizmsg是什么文件可以删除吗_C盘里的文件夹都是什么?可以删除吗?哪些可以删除?...
- DBeaverEE7.3.0安装教程
- 使用cloudera manager安装Hue服务【详细步骤】
- 未能加载文件或程序集“XXX”或它的某一个依赖项。试图加载格式不正确的程序。...
- 在vue.js中如何导出Excel表格
- 链路冗余的解决和故障的备用方案
- typedef用法,函数指针
- 网站建设备案和不备案的一些疑惑问题大全
- 关于国内LTE宽带集群通信知识现状介绍
- Python3对股票数据进行分析
- 多款比较好用又免费的设计工具
- 英语:日常用语中的错误表达和正确表达
- 网络安全从入门到精通的学习资源汇总
- VGA原理详解与verilog实现RGB888彩条(二)
- 教会微信:突破文件发送100M限制
- 不可见字符和表情包正则
- JVM虚拟机-----垃圾回收相关概念
- 单片机入门(Proteus仿真)-----8x8LED点阵屏基础操作
- arm11 s3c6410 开发板 学习板 工业开发板 比较 国内主流的arm开发板比较
热门文章
- TIM学习文档18——TIM部署之组织结构
- python nonlocal的用法_python中的global和nonlocal关键字怎么使用
- 努力的天才-一代K神(克洛泽)
- 14 种免费 GIS 软件:在开源中绘制世界地图
- 美研制出压力感觉超灵敏的人造皮肤
- iPhone手机使用:手机应用更新之后,应用图标下面文字前边出现蓝色小圆点的去掉方法
- python打印楼梯和笑脸_用Python的Turtle库打印楼梯,并打印笑脸:)
- Lua 面向对象 创建类实例
- vue中自适应rem的设置及vant组件库px自动修改为相对大小的方法两则(postcss-pxtorem和postcss-px-to-viewport)
- 程序内存分配 栈和堆