大家好,我是辣条,这是爬虫系列的32篇。

前言

爬虫系列太难了,我算了一下这个系列从开始到现在我写了40篇左右了,但是现在这个专栏只显示30篇左右,大概有10篇左右下架了因为版权或者违规的问题,难受...

采集目标

网址:

https://m.wcbchina.com/login/login.html?service=https://m.wcbchina.com/my/my.html&bp=https%3A//m.wcbchina.com/my/my.html

工具准备

开发工具:pycharm 开发环境:python3.7, Windows10 使用工具包:requests,md5

项目思路解析

这个数据的逆向是app的数据,想要解析的话大部分进行app的数据逆向,用在web网页的时候需要通过抓包工具进行设定,将左上角第二个选项点亮,把浏览器设置为手机的模式。

先输入错误的账户密码找到登录的请求接口,在进行数据的解析处理。

找到数据后开始进行解析:

  • 请求网址为:https://m.wcbchina.com/api/login/login?rnd=0.6807164275086108

  • 请求方法为:post

  • 需要携带的请求头:user-agent

  • 需求传递的参数:传递的数据类型为json,

  • {"auth":{"timestamp":1635225584675,"sign":"1992F839A06E27B22A03ADFAA6630F44"},"username":"17673942335","password":"D3432F4A98143D1951496D31ED76B5E2"}

重数据中可以看出数据网址里的rnd的值是随机数0-1的随机数,传递数据的timestamp为时间戳,sign,和password都是加密数据,确定数据后开始进行解析,解出sign和password的生成规律 通过搜索方式找到数据的生成位置,数据的加密方式为md5加密,可以打断点验证数据是否为我们想要的数据,sing的数据是 N , N的值是由h.hex_md5((v || "") + (g || "") + c).toUpperCase()生成的

打上断点查看数据的生成结果v和g的值都是空数据,c的数据是时间戳,那最终的sing的数据是对时间戳进行md5的加密加字符串大写的值,sing的值确定在来找password的值,在全局搜索password的关键字。

password的值是在loginAction进行获取在c.login进行参数传递,传递的数据密码就是md5的加密数据,password和sing数据都是进过md5加密的数据,思路清楚后开始书写代码。

简易源码分享

import requests   # 发送网络请求的工具包
import json
import time
import random
from hashlib import md5
​
def main():url = "https://m.wcbchina.com/api/login/login?rnd=" + str(random.random())password = input('请输入你的密码:')password = md5(password.encode()).hexdigest()print(password.upper())time_data = int(time.time()*1000)sign = md5(str(time_data).encode()).hexdigest().upper()
​data = {"auth": {"timestamp": time_data, "sign": sign},"username": "17673942335","password": password.upper()}
​
​response = requests.post(url, data=json.dumps(data))print(response.json())
​
main()
​

万创帮逆向解析,让你也能体验技术变现【Python爬虫实战系列之万创帮闲置资源整合逆向】相关推荐

  1. Python爬虫实战:京东拍拍验机(帮你买到最完美的二手iPhone)

    文章目录 网站介绍&使用痛点 网站分析 项目实施 1. 爬取commodityId 1.1 失败的爬取思路 1.2 改进后的巧妙的爬取思路 2. 增加筛选项 3. 筛选所有商品 PS 网站介绍 ...

  2. Python爬虫实战 | (12) 爬取万方数据库文献摘要并存入MongoDB

    之前在Python爬虫实战(7)中曾爬取过万方,本篇博客的爬取解析过程和之前几乎完全一样,不同的是数据存储方式,之前是存储到文件中(csv,txt,json,excel等),这次我们将提取的论文信息存 ...

  3. app小程序手机端Python爬虫实战12实现自动化退出考研帮app并清空缓存

    app小程序手机端Python爬虫实战11实现自动化退出考研帮app并清空缓存 一.捕获安卓吐司的消息 结束安卓的吐司操作: while True:if self.d.toast.get_messag ...

  4. Python爬虫实战之xpath解析

    XPath 是一门在 XML 文档中查找信息的语言,最初是用来搜寻 XML 文档的,但是它同样适用于 HTML 文档的搜索. 所以在Python爬虫中,我们经常使用xpath解析这种高效便捷的方式来提 ...

  5. 你爱我,我爱你,IP被封很头疼【Python爬虫实战:ip代理js逆向采集】

    大家好,我是辣条. 一见不日甚是...应该是一日不见甚是想念[串台了,这是郭德纲老师相声里的梗]. 直接进入今天的主题,相信学过爬虫的朋友们都知道爬虫封ip十分头疼,辣条今天带你获取免费ip代理 爬取 ...

  6. python爬虫实战之逆向分析酷狗音乐

    文章目录 前言 一.请求分析 二.逆向思路 三.全部代码 总结 前言 声明:本文章只是用于学习逆向知识,仅供学习,未经作者同意禁止转载 对于爬虫而言,不管是什么类型的都会遵循这几个步骤 获取目标url ...

  7. Python爬虫实战 | (7) 爬取万方数据库文献摘要

    在本篇博客中,我们将爬取万方数据库,首先我们打开万方首页http://www.wanfangdata.com.cn: 在搜索框中输入关键词,选择期刊.学位或会议,点击搜论文,并可得到与关键词相关的期刊 ...

  8. Python爬虫实战:世纪佳缘爬取近6万条小姐姐数据!脱单的有望!

    马上又是一年双十一了,不知道从什么时候开始,双十一从"光棍节"变成了"双十一购物狂欢节",最后一个属于单身狗的节日也成功被攻陷,成为了情侣们送礼物秀恩爱的节日. ...

  9. python爬虫实战之旅( 第三章:数据解析(xpath法))

    上接:第三章:数据解析(bs4法) 下接:第四章:验证码识别 1.xpath解析简介 最常用且最便捷高效的一种解析方式.通用性很好 xpath解析原理 实例化一个etree的对象,且需要将被解析的页面 ...

最新文章

  1. String 类中怎么出现此类问题?
  2. reactjs 全局状态管理:redux的组成
  3. 推荐一个实用的 .gitignore 文件
  4. Kotlin学习笔记 第一章开始 第二章 基础
  5. HandBrake for Mac(专业的视频转码器) 最新版
  6. matlab使用webcam获取摄像头图像,camList = webcamlist
  7. java.lang.IllegalArgumentException: name MUST NOT NULL! at org.nutz.dao.impl.NutDao.fetch
  8. C#移除对象中的属性(model类或集合等)JObject
  9. Ps 原来排版证件照如此简单(╹ڡ╹ )
  10. 飞天特效腾云驾雾特效手机软件制作特效视频的教程
  11. pyhanlp 实体命名识别
  12. win7事件查看器事件id_使用免费工具从事件查看器中查找事件ID
  13. lol人物模型提取(七)
  14. 北京找工作之艰难困苦
  15. 鸡啄米编程入门教程代码实现
  16. php中的id是什么意思,itemId是什么意思
  17. 游戏推荐,游戏荒的快来挖宝
  18. 【获取微信小程序openLink】“errcode”:40001,“errmsg”:“invalid credential, access_token is invalid or not latest
  19. php域名301跳转,php 获取根域名 并301跳转www域名
  20. SwiftUI Core NFC 基础教程

热门文章

  1. struts2+spring+mybatis简单配置
  2. 父子域+主辅域控的搭建
  3. 使用 Postman 调试 HTTP(s) 接口
  4. Shell 条件表达式的正则匹配
  5. Linux 命令(49)—— export 命令(builtin)
  6. 树堆(Treap)图文详解与实现
  7. Windows 命令行基础(博主推荐)
  8. 渗透测试专题二之msf(kali)的攻击教程将DOS操作系统中的本地文件接口“中断13”改造为网络文件系统...
  9. lucene-SpanNotQuery和SpanOrQuery交迭与全局跨度
  10. 测试开发Python培训:抓取新浪微博抓取数据-技术篇