最近有朋友在做新闻资讯类的 app 爬虫,也许大多数人都会认为,一个新闻资讯 app 不会有什么反爬吧。

恰恰相反,当你想爬一条新闻的时候都有请求参数加密,可见现在反爬的严重性。

分析

国际惯例先抓包,万幸抓包非常顺利,抓包结果如下:

可以看到请求头里面有加密的参数,下面我们通过反编译来破解这个参数,同时用 Python 代码来实现加密

这样我们才能愉快的爬爬爬!

反编译破解

反编译之后我们就根据请求参数来寻找加密的源码,同时需要注意下搜索的技巧

比如同一个参数,如果加上引号会极大的减少我们的工作量。

可以看到同样一个参数,按后面的搜索结果来找加密源码,会大大减少我们的工作量

最后在第三行找到了加密参数的出处

其中在执行某某函数的地方可以点进去,结果如下:

md5 应该熟悉吧,剩下就是找出被加密的数据了。返回再看,是三个数据组合的 md5

粗略看一下这个参数是设备号,不做校验,我们可以直接取默认值

IMEINNNNNNNNNNNNNNN-IMSI460NNNNNNNNNNNN

再加上时间戳,和一个 key。刚好和我们抓包里面的请求头那几个参数对应上

分析完之后,当然是先用代码验证一下,如果有问题再返回回来细看。

验证

下面是构造加密参数 signature 的算法

1encrypt = f"{uuid}&&{timestamp}&&f1190aca-d08e-4041-8666-29931cd89dde"

其中 udid 是手机设备号和随机数按特定的方式的组合,timestamp 是时间戳

1signature = hashlib.md5(encrypt.encode("utf-8")).hexdigest()

上面就是 signature 的加密 。我们用代码请求一下来验证结果

能 GET 到数据,说明用 python 转换后的加密算法是对的!

python爬虫之逆向破解_Python爬虫进阶之APP逆向(二)相关推荐

  1. python爬虫基础项目教程_Python爬虫开发与项目实战_Python教程

    资源名称:Python爬虫开发与项目实战 内容简介: 随着大数据时代到来,网络信息量也变得更多更大,基于传统搜索引擎的局限性,网络爬虫应运而生,本书从基本的爬虫原理开始讲解,通过介绍Pthyon编程语 ...

  2. python爬虫微博评论图片_python爬虫爬取微博评论

    原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...

  3. python爬取收费素材_Python爬虫练习:爬取素材网站数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 在工作中的电子文案.ppt,生活中的新闻.广告,都离不开大量的素材,而素材 ...

  4. python爬虫抓取房产_Python爬虫实战(3):安居客房产经纪人信息采集

    1, 引言 Python开源网络爬虫项目启动之初,我们就把网络爬虫分成两类:即时爬虫和收割式网络爬虫.为了使用各种应用场景,该项目的整个网络爬虫产品线包含了四类产品,如下图所示: 本实战是上图中的&q ...

  5. python基础知识500题_python爬虫基础知识点整理

    更多编程教程请到:菜鸟教程 https://www.piaodoo.com/ 友情链接: 高州阳光论坛https://www.hnthzk.com/ 人人影视http://www.sfkyty.com ...

  6. python爬虫爬取图片代码_Python爬虫入门:批量爬取网上图片的两种简单实现方式——基于urllib与requests...

    Python到底多强大,绝对超乎菜鸟们(当然也包括我了)的想象.近期我接触到了爬虫,被小小地震撼一下.总体的感觉就两个词--"强大"和"有趣".今天就跟大家分享 ...

  7. 基于python爬虫的论文标题_python爬虫——简单论文标题检索-Go语言中文社区

    有趣的爬虫,独有的意义召唤着我去学习,去尝试.最近有感于每天对于论文的收集,感觉自己的收集速度赶不上论文的更新速度,同时对于自己想找到的论文的收集比较麻烦.因此,学习用python写一个很简单的爬虫, ...

  8. python打开网页被禁止_Python爬虫被禁?看看是不是这几个问题

    Python爬虫在网上完成网站的信息采集时,常常出现无缘无故的ip被禁的情况,正爬取呢就没法继续了,造成日常业务也没办法正常进行了,整个人都不好了呢.一部分人完全不清楚被禁的原因,这么简单的就给禁掉了 ...

  9. python爬虫快速下载图片_Python爬虫入门:批量爬取网上图片的两种简单实现方式——基于urllib与requests...

    Python到底多强大,绝对超乎菜鸟们(当然也包括我了)的想象.近期我接触到了爬虫,被小小地震撼一下.总体的感觉就两个词--"强大"和"有趣".今天就跟大家分享 ...

最新文章

  1. 微服务架构10个最重要的设计模式
  2. C七:指向函数的指针 ------ 函数指针(function pointer)
  3. linux进程故障如何修复,33.Linux开机过程及启动故障修复
  4. boost::sort模块实现spreadsort 浮点函子排序示例
  5. 一次恐怖的 Java 内存泄漏排查实战
  6. adminer.php下载,Adminer.php
  7. 通过IP判断登录地址
  8. ahjesus sql2005+游标示例
  9. 如何使用微软官方工具MediaCreationTool来制作Windows10启动盘
  10. Java面试题十二:Java内存模型,h5移动端开发面试题
  11. 虚拟机搭建与镜像文件
  12. 电脑主板详细介绍(细图!!)
  13. 外星人冯诺依曼【转】
  14. 读书笔记: Cartesian Impedance Control of Redundant and Flexible-Joint Robots, Section 1
  15. 无法加载文件 XXX,因为在此系统上禁止运行脚本。有关详细信息,请参阅 https:/go.microsoft问题解决
  16. im即时通讯开发:高可用、易伸缩、高并发的IM群聊、单聊架构方案设计
  17. 中国地热能产业需求预测与投资规划建议报告2022-2028年版
  18. LeetCode : 502. IPO 分析与解答
  19. 第三章 区块链技术架构与发展趋势
  20. RSD 遥感数据处理——对象分析

热门文章

  1. 账户配置 三: Gmail
  2. java已被弱化签名,高效Java第四十条建议:谨慎设计方法签名
  3. 详解java访问修饰符
  4. 成为项目经理需要具备什么条件?
  5. 自旋锁和互斥锁实例_多线程编程之自旋锁
  6. python中要使用导入全部的是什么符号-在python格式字符串中使用标点符号
  7. Java中List和Map接口之间的区别
  8. python 使用异常函数_您如何测试Python函数引发异常?
  9. iis php mysql 集成_如何在IIS上集成php(iis+mysql+php+zend)
  10. c 语言开发一个四则运算器,C++实现四则运算器(无括号)