爬虫逆向学习进阶路线
大数据时代下,爬虫技术逐渐成为一套完整的系统性工程技术,涉及的知识面广,平台多,技术越来越多样化,对抗性也日益显著。
大家可以参考一下学习路线,看看自己需要对哪些知识进行补充。
爬虫逆向学习路线
- 学习路线总结
- 系统提高
- 加密算法特征和实现
- 传输协议和通讯协议
- 各种验证码识别方法
- 个人汇总专栏
- 爬虫逆向社区
学习路线总结
基础学习路线总结:
- 主语言基础语法
- 常用网络请求库、解析库
- 常用抓包工具
- 自动化工具库
- 流行采集框架
- 多进程、多线程、协程、分布式爬虫
- 采集器管理
Js逆向学习路线总结:
- 浏览器构造、基础语法、作用域
- Bom、Dom属性和方法
- 调试工具
- 加密参数定位方法
- 常见混淆和加密
- 浏览器环境补充
- AST
小程序逆向学习路线总结:
- 小程序基础架构
- 小程序语法
- 反编译工具
- 代码修复
- hook方法
安卓逆向学习路线:
- 安卓逆向原理
- java、smali、arm语法
- 反编译工具
- 加密参数定位方法
- 调试和hook工具
- 反检测和反调试
- 加固和脱壳
系统提高
加密算法特征和实现
需要掌握常见加密算法,MD5、AES、DES、RSA、HASH、ECC等在Js和java代码中的特征及我们的主语言实现方法。
python实现: https://blog.csdn.net/tongtongjing1765/article/details/106010143
java实现:https://blog.csdn.net/zl1zl2zl3/article/details/85331976
go实现:https://blog.csdn.net/weixin_42117918/article/details/82870809
传输协议和通讯协议
一些自定义的协议暂不列出了,总结一下常见的。
传输协议:json、xml、protobuf、tlv 等
通讯协议:http/https、tcp/udp、ws/wss、tls 等
各种验证码识别方法
验证码种类很多,各种验证方式也层出不穷,这里列出常见的验证。
具体解决方法可以到github查找开源识别库。
- 图文验证码:图文识别、逻辑计算
- 滑动验证码:缺口拼图、轨迹验证
- 点选验证码:文字点选、图标点选
- 逻辑验证码:语义识别、空间推理
- 短信验证码:接码平台、hook监听
2022新书上市《爬虫逆向进阶实战》
个人汇总专栏
专栏以教学为基准,提供的可操作性不得用于任何商业用途和违法违规场景。
网络爬虫基础 : 适合有python语法基础
web逆向基础 : Js逆向案例,有爬虫经验即可
安卓逆向基础 :工具介绍、逆向记录、案例分享
爬虫案例合集 :工作中的案例总结,持续更新
Github代码库
爬虫逆向社区
爬虫逆向社区:https://bbs.csdn.net/forums/lx
可在社区进行技术分享,有问题也可以问答交流,欢迎大家加入!
爬虫逆向学习进阶路线相关推荐
- 算法工程师0——算法工程师学习进阶路线
如果想进行python学习,下面是一条很详细的流程图,具体学习内容参考黑马的培训: http://www.itheima.com/ 不打广告,不打广告! 黑马的课程在b站和淘宝都可以找到,自学能力差请 ...
- MySQL学习进阶路线
根据2019 数据库趋势报告显示,年度最受欢迎的数据库是 MySQL. 虽然市场占有率Oracle排名第一,MySQL和SQLServer并驾齐驱,但毫无疑问,MySQL正变得越来越流行. 随着MyS ...
- Java软件测试工程师之学习进阶路线
Java软件测试工程师进阶路线 1.资深软件测试工程师 一般情况下,软件测试工程师可以分为测试工程师.高级测试工程师和资深测试工程师3个等级. 想要达到资深软件测试工程师,需要了解很多知识,比如C语言 ...
- Java开发学习进阶路线
今天LZ是打算来点干货,因此咱们就不说一些学习方法和技巧了,直接来谈每个阶段要学习的内容甚至是一些书籍.这一部分的内容,同样适用于一些希望转行到Java的同学. 在大家看之前,LZ要先声明两点. 1. ...
- Linux学习进阶路线
转载地址:http://www.nowamagic.net/librarys/veda/detail/2054 为什么要学习Linux? 为什么学Linux,每个人都有自己的理由: Linux是免费的 ...
- 爬虫逆向学习(二):那些年遇到的花式字体反爬
常见字体反爬破解策略 CSS偏移反爬虫 案例场景 破解策略 SVG字体反爬 案例场景 破解策略 自定义字体反爬 案例场景 破解策略 CSS偏移反爬虫 案例场景 css偏移反爬虫是通过样式left偏移覆 ...
- python3爬虫进阶JS逆向学习(十一)
目的 目的:JS逆向的学习与交流 目标:分析咪咕音乐参数 目标网址:https://music.migu.cn/v3 // 若有侵权,请联系作者删除,谢谢! 思路分析 一.内容概览 二.请求参数分析 ...
- 《爬虫逆向进阶实战》书籍介绍
<爬虫逆向进阶实战>书籍介绍 内容简介 <爬虫逆向进阶实战>以爬虫逆向方向的相关技术和岗位要求进行撰写,结合作者多年工作经验,总结了爬虫的架构体系.主流框架.技术体系和未来发展 ...
- Android逆向 学习Android安全和逆向开发的路线总结,啃下这些Framework技术笔记
此篇整理了最完整的–Android逆向学习线路知识体系.希望给迷糊的入门者指出一个明确的方向. 真心建议:先正向开发几年再搞逆向吧--正向都不会破解的是啥?不看代码只会脱壳?只会xposed ?远远不 ...
最新文章
- matlab调用opencv的函数
- 剑指Offer_12_数值的整数次方
- 计算机中丢失了ll是什么意思,丢失了ntoskrnl.exe和hal.ll
- mac android sdk manager速度慢,android - SDK Manager无法在Mac上打开 - 堆栈内存溢出
- 实现删除商品信息功能
- extends 和super 泛型限定符-上界不存下界不取
- Spring Boot中文文档
- python2.7.11 for iOS 苹果上的python27环境
- 【图像压缩】基于matlab BP神经网络图像压缩【含Matlab源码 741期】
- 【Python程序设计(七)】文件和数据格式化
- 将hustoj 数据从Ubuntu 14.04 成功迁移到 ubuntu 16.04
- AD域创建及加入域的办法
- 基于LabVIEW的图片上数字识别(特征点)
- 《九》微信小程序中的自定义组件
- 马华兴、王鹏《做出好选择》读书笔记
- Qgis入门指南+各种可视化地图
- 含泪整理最优质行书字体素材,你想要的这里都有
- 逃离迷宫 ( BFS /DFS)
- Github上Stars最多的53个深度学习项目
- route---路由
热门文章
- 倩女服务器维护时间,《倩女幽魂》更新公告
- 计算机安全技术 实验报告,网络安全技术实验报告(共10篇).doc
- Vue小黑记事本案例
- DEFORM文本模式(4):后处理结果的提取
- 理光打印机Ricoh_MP_C2003_C2503_Pcl6祥闰内部打印机安装使用教程
- CentOS开发环境搭建
- 文件目录和目录文件的作用区别和联系 C语言文件相关操作 FILE用法
- 4个基本不等式的公式高中_高中4个基本不等式的公式
- selenium模拟geetest极验滑动验证
- Cesium-通过Shader添加雨雪天气效果