破解js加密反爬综述

微信公众号:在敲代码啦

闲谈

上周发懒,没有更贴。结果一个小伙伴居然私我希望我周更帖,这个消息对我来说是莫大的鼓励。总是胡说八道的我居然得到了小伙伴的认可,这足以让我嘚瑟一整子。这次决定给大家带来一些干货,分享一下我破解js加密反爬的经验,希望对大家能有所帮助。

正文

破解js加密反爬主要分三步:一、js代码调试;二、查询关键词的确认;三、js核心逻辑的实现。

一、js代码调试

调试js代码是破解需要的最基础技能,需要在F12状态下标注断点,调试断点。熟练掌握断点操作的快捷键(F8, F10, F11)。

二、查询关键字的确认

破解js加密需要找到js算法的位置,才能分析算法逻辑。于是确认查询关键字也是极其重要的。

关键词确认方式:

1. 加密参数的参数名, 如token,sign等;

2. 触发异步加载标签的class,id等关键词;

3. 加密算法的名称,如md5,aes,base64, encrypt等。

三、js核心逻辑的实现

js核心算法的实现有三种方案:

1. python代码仿写js逻辑

2. python调用js代码

3. 自动化控件调用js函数

经典案例

1、首都航空

加密方式:desc

查询关键词:murmurhash3

https://blog.csdn.net/qian123shuai/article/details/88406671

2、JC航空

加密方式:md5

查询关键词:hex_md5

https://blog.csdn.net/lsh19950928/article/details/81585881

3、美拍爬虫逆向

加密方式:base64

查询关键词:decodeMp4

https://blog.csdn.net/z434890/article/details/84995988

这三个案例中,desc算法和base64算法加密的字符是可逆的,md5加密的字符是不可逆的。可逆的算法会用来加密目标数据,不可逆的算法一般只会加密sign,token值。

常见的前端js加密有aes,des,md5,base64。加密算法都会隐藏在js代码深处,找准js逻辑既需要有耐心也需要一个准确的查找关键字。按照上述思路,能够准确高效的找出对应的算法。如果你还有什么好的想法啦。欢迎大家留言。

欢迎大家关注公众号(在敲代码啦),定期和大家分享一些爬虫知识。

破解js加密反爬综述相关推荐

  1. Python爬虫:爬取instagram,破解js加密参数

    Python爬虫:爬取instagram,破解js加密参数 instagram 是国外非常流行的一款社交网站,类似的还有像facebook.twitter,这些社交网站对于掌握时事热点.电商数据来源和 ...

  2. 爬虫破解js加密破解(二) 有道词典js加密参数 sign破解

    在爬虫过程中,经常给服务器造成压力(比如耗尽CPU,内存,带宽等),为了减少不必要的访问(比如爬虫),网页开发者就发明了反爬虫技术. 常见的反爬虫技术有封ip,user_agent,字体库,js加密, ...

  3. 大众点评列表页采集思路,破解字体文件反爬(包含项目github 可用时间至2020-01-21)

    前言:最近想试试抓取大众点评数据,找了些开源代码发现基本上都用不了.自己写了一个能跑起来的项目,分享给大家,首先抓取"海底捞"店铺的列表页数据. 注意,大众点评的采集需要全程登录, ...

  4. 爬取拉钩 破解拉钩反爬机制

    破解拉钩反爬 实现爬取内容 拉钩的反爬很厉害 没毛病 老铁!! 我们现在来研究一下拉钩的请求头先 导入的有一个ip池(get_ip) ip池可以不写 用自己的也不会被封掉还有我是第一次写这些文章 给个 ...

  5. 反爬虫 破解js加密-有道翻译

    js 加密 有的反爬虫策略采用js对需要传输的数据进行加密处理(通常是取md5值) 经过加密,传输的就是密文,但是加密函数或者过程一定是在浏览器完成,也就是一定会把代码(js代码)暴露给使用者 通过阅 ...

  6. 汽车之家字体加密破解(CSS样式反爬)

    废话不说多,直接切入主题. 能来到这里的应该都已经发现汽车之家论坛以及一些频道的网页源码是这种: 刚看到这里的时候,想到刚学爬虫时所听说的CSS样式反爬,没错,就是这个.破解方法就是破解其字体文件即可 ...

  7. python爬虫--破解js加密:kankan登录破解

    这一系列文章旨在解决python 爬虫过程中遇到的各种反爬,从简单到复制,是个进阶的过程.如果对你有帮助,欢迎关注. 今天要破解的网站是天天看看(http://www.kankan.com/)的登录, ...

  8. 爬虫入门经典(二十) | 破解JS加密之有道翻译

      大家好,我是不温卜火,是一名计算机学院大数据专业大三的学生,昵称来源于成语-不温不火,本意是希望自己性情温和.作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己 ...

  9. 使用Python破解代理网站反爬策略,获取大量免费代理

    最近在做关于某视频网站爬虫时发现了一个可以通过API大量提取免费代理的网站,但美中不足的是该网站的反爬措施相当严格(?),便着手破解. 直接使用requests.get访问,返回的结果为混淆后的JS代 ...

最新文章

  1. 来客推商城V3多用户uni-app商城源码如何搭建?盈利模式怎么样的?
  2. NIPS 2017录用论文先睹为快!论文作者清华专场分享(附PPT下载)
  3. 记一次小机器的 Python 大数据分析
  4. Commons Logging 快速入门(五)
  5. 王道计算机考研 数据结构 (查找-上)
  6. react(79)--ant design确认框
  7. linux emacs命令,Linux Bash Shell 终端 Terminal Emacs 模式 常用 快捷键 命令
  8. java 1.8有没有jshell_收藏了800道Java后端经典面试题,分享给大家,希望你找到自己理想的Offer呀~...
  9. 2017级C语言大作业 - 气球塔防
  10. keepalived双机热备原理及实例部署LVS+keepalived
  11. java使用websocket,并且获取HttpSession,源码分析
  12. MyBatis-Plus-Generator配置
  13. mysql数据备份3种方案
  14. JAVA远程声卡,Delphi带多声道声卡(ASIO)
  15. 联想Thinkpad T580 20L9 20LA Wistron LTS-2 17812-1笔记本点位图
  16. 软件架构设计-软件架构风格、分层架构
  17. 【磁盘】 文件外存分配方式
  18. linux去除pdf页头,删除PDF水印小妙招
  19. 大学计算机实验图灵机模型与计算机硬件,北理大学计算机实验基础 实验一_图灵机模型与计算机硬件系统虚拟拆装-实验报告...
  20. Windows 2003全面优化

热门文章

  1. Problem C. 狙击敌人
  2. 【卸载教程】windows8.1 下完全卸载迈克菲McAfee杀毒软件
  3. 梦想CAD控件文字COM接口知识点
  4. 第10章 网络与信息安全基础知识
  5. Qt控件滑块QSlider的图片使用注意事项
  6. uboot移植之修改支持NandFlash识别篇6(超详细)
  7. python批量下载文件只有1kb_python 批量下载文件
  8. PostgreSql数据表清理
  9. 2022制冷与空调设备安装修理题库模拟考试平台操作
  10. 读卡器读不出卡,但通过数据线方式能读到卡,是卡有问题还是读卡器有问题?...