国家企业信用信息公示系统及30多个省份的子系统均采用了加速乐的反扒,仔细研究可发现其主要的5个cookie(__jsluid_h, __jsl_clearance, JSESSIONID, SECTOKEN, tlb_cookie)是多次请求结果运算得出的。

下面附请求步骤及源码:

1、第一次访问http://www.gsxt.gov.cn/index.html, 得到响应,HTTP状态码521,响应内容为混淆后的js代码:,处理字符串删掉=前和;后的代码,使用python js引擎执行该段代码会得到__jsl_clearance的值,__jsluid_h 的值在headers[‘Set-Cookie’]取得。

2。带着第一步算出来的两个cookies第二次访问http://www.gsxt.gov.cn/index.html, 得到响应,HTTP状态码521,响应内容为混淆后的js代码,使用正则处理后取得我们想要的代码段:go({"bts":["1608628995.812|0|808","WKB31Vg1BYyNVBpbBUuuhQ%3D"],"chars":"ZiiLFCcQzBPoefDhSVUDVo","ct":"7e287d4ccc0959fc5c9b0e037e54208e55260005","ha":"sha1","tn":"__jsl_clearance","vt":"3600","wt":"1500"}),这几个值就是算出终极cookies必须参数,cookieTemp = bts[0] + chars[i] + chars[j] + bts[1],ct为使用返回的"ha"的加密算法计算出的临时值,"ha"算法有三种,sha1,sha256和md5,我们需要使用双层循环i,j暴力算出当cookieTemp ==ct时,i和j的值,当i,j算出来后就可以拼接正确的更新后的__jsl_clearance的值cookie= bts[0] + chars[i] + chars[j] + bts[1]了。

3,使用第二步算出的更新后的__jsl_clearance的值和第一步的__jsluid_h 的值第三次访问http://www.gsxt.gov.cn/index.html, 得到响应,HTTP状态码200,第三次请求的headers里会有我们想要的另外三个cookies:JSESSIONID, SECTOKEN, tlb_cookie,拼接好这5个cookie就可以访问拿数据了。下面附请求脚本

python爬虫国家企业信息网_国家企业信用信息公示系统爬虫相关推荐

  1. 国家企业信用信息公示系统爬虫

    本文仅供学习交流使用,请勿用于商业用途或不正当行为 如果侵犯到贵公司的隐私或权益,请联系我立即删除 国家企业信用信息公示系统及30多个省份的子系统均采用了加速乐的反扒,仔细研究可发现其主要的5个coo ...

  2. 国家企业信用信息公示系统爬虫——流程分析

    本文仅供学习交流使用,请勿用于商业用途或不正当行为 如果侵犯到贵公司的隐私或权益,请联系我立即删除 20201212更新,附上第二步js改写的代码 # 2.第二次访问http://www.gsxt.g ...

  3. JS逆向之国家企业信用信息公示系统Cookie传递

    目标地址 http://www.gsxt.gov.cn/corp-query-entprise-info-xxgg-100000.html 分析 POST http://www.gsxt.gov.cn ...

  4. 艺赛旗(RPA)国家企业信用信息公示系统验证码破解(一)

    目前艺赛旗RPA已经更新到8.0版本,可以让所有用户免费下载试用http://www.i-search.com.cn/index.html?from=line1 (复制链接下载) 我们一般会通过国家企 ...

  5. 【爬虫】关于企业信用信息公示系统-加速乐最新反爬虫机制

    ( ̄▽ ̄)~*又得半夜修仙了,作为一个爬虫小白,花了3天时间写好的程序,才跑了一个月目标网站就更新了,是有点悲催,还是要只有一天的时间重构. 升级后网站的层次结构并没有太多变化,表面上是国家企业信用信 ...

  6. 全国企业信用信息公示系统

    全国企业信用信息公示系统 http://gsxt.saic.gov.cn/

  7. 【004】国家企业信用信息公示系统-官方渠道查询企业信息

    商业活动中,难免会和一些企业打交道,那么如何了解企业的基本信息尤其是信用信息呢?在有相关需求时可以选择企某查或者天某查等第三方平台查询,也可以选择官方的"国家企业信用信息公示平台" ...

  8. python爬虫-国家企业_自动查企业工商登记信息(企业信用信息公示系统、极验Geetest与Python爬虫)...

    一.引言: 信贷作业的过程就是信息搜集和验证的过程.对于企业客户,最权威的信息渠道莫过于工商登记信息,各种第三方查询工具(天眼查.启信宝.各种各样的API等等)也来源于此. 常见的问题在于,我们不仅要 ...

  9. Python爬虫-国家企业信用信息公示系统App

    https://blog.csdn.net/weixin_34236497/article/details/86998539 转载于:https://www.cnblogs.com/yuyu666/p ...

  10. 艺赛旗(RPA)国家企业信用信息公示系统验证码破解(二)

    艺赛旗 RPA8.0全新首发免费下载 点击下载 http://www.i-search.com.cn/index.html?from=line1 为了验证码破解的稳定性,这里选择 selenium+C ...

最新文章

  1. vue 输入框限制3位小数_vue+element 中 el-input框 限制 只能输入数字及几位小数(自定义)和输入框之键盘...
  2. GARFIELD@05-04-2005
  3. 【C 语言】数组 ( 指针数组用法 | 菜单选择 )
  4. react之bind函数到组件通识篇
  5. 独一无二的《斗罗大陆》小游戏火爆上线,玩家闯关等你来~(等级有点儿难)
  6. java下载pdf6_疯狂java讲义第6版 电子版(pdf格式)
  7. HTML--三种样式插入方法--链接---表格---列表
  8. 【数据结构与算法】之深入解析“最长连续序列”的求解思路与算法示例
  9. getexternalfilesdir 相册_音乐相册(电子相册制作)V5.2 安卓最新版
  10. Windows监听进程的两个函数
  11. ssh java_java中的SSH的各自作用是什么-百度经验
  12. discuzX 数据库操作类
  13. JSPServlet相关
  14. linux 查看网卡名字
  15. Mint UI - 饿了么出品的开源、轻量的移动端 UI 组件库
  16. 1585 Amount of Degrees
  17. 《用户体验要素——以用户为中心的产品设计》读书笔记
  18. SAP HANA XS ODATA使用参数展示数据结构
  19. Android Studio打不开,出现start failed的报错
  20. 【逆向基础】常用逆向工具介绍

热门文章

  1. Adobe Photoshop CS5 12.0 Extend 绿色免安装版
  2. TensorFlow Session 中关于 GPU 的配置项解析 ——转自 慢慢学TensorFlow 微信公众号
  3. IDA报错Unexpected fatal error while intitailizing Python runtime
  4. 智课雅思词汇---十二、vent是什么意思
  5. html 分享页面到微博qq空间
  6. php 0x80004005,解决Access出现Microsoft JET Database Engine (0x80004005)未指
  7. SQL查询实现差集(补集)运算
  8. Python的数据类型
  9. 里奥·梅西(Lionel Messi)-----球场上舞动的红蓝精灵
  10. 一文分析 Android现状及发展前景