【企查查、天眼查、企业信息,企业目录】

  • 高级查询界面
  • 限制条件
  • 突破思路
  • 结果展示

高级查询界面

限制条件

  • 即使VIP,对单个筛选条件下的查询数据也只能有前5000条。并且有导出次数限制

突破思路

  • 1、将一个查询条件下的数据进行时间拆分,例如拆分为5天时间段,每次的数据量会下降到5000以内
  • 2、用selenium对查询进行时间拆分点击,写算法对数据量判断自动拆分时间,保证时间段内的数据大于4000小于5000

这样处理以后几十万的数据量会被拆分成每个时间段处理从而达到全量导出的效果,一天数据量超过5千,可以按原理拆分城市、行业

  • 3、最后实现主要用selenium+requests方法完成,selenium查询点击,requests导出数据

结果展示

导出结果与官方数据一致,仅展示部分字段

【企查查】高级查询下突破导出5000条/10次限制思路tips,完整全量导出相关推荐

  1. 【Python网络爬虫】企查查高级搜索及批量查询接口爬虫

    写在前面: 本文所介绍的企查查爬虫代码需要用到cookie,且cookie所对应的账号需要为vip或以上等级具有高级搜索和批量查询的功能,无此功能的账号暂不支持: 本文所介绍的是在其他人分析了前端he ...

  2. java 调用企查查API查询企业信息

    效果图: 首先需要设置token,API中要求token的格式为key+Timespan+SecretKey组成的32位md5加密的大写字符串,所以我也附赠了MD5加密的工具类.token要放在htt ...

  3. mysql查询前5000条记录分页显示_数据库 完整的查询语句,查询顺序及分页显示功能...

    基本的查询语句​ select (* | 字段名 | 四则运算 | 聚合函数) from 表名称; 取别名 当字段名显示较长时 可以添加别名​ select 字段名 as 别名 from 表名称;​ ...

  4. linux百万行数据加分页符,百万级数据量报表全量导出

    java中使用poi导出Excel详解java当初把核心处理设成Unicode,带来的好处是代码适应了多语言环境.然而由于老外的英语只有26个字母,有些情况下,一些程序员用8 位的byte处理,一不小 ...

  5. oracle视图数据全量导出,Oracle 导出视图view中的数据

    1 将视图中的数据变成表数据,将表导出. create table test_table as( select * from view_table); 2 用sql development 导出,或者 ...

  6. Java 查询企业基本信息接口实现(企查查)

    因项目需要,系统中需要添加根据企业名称或统一信用代码查询企业信息的功能,所以整合了企查查的查询接口 接口文档地址 Java请求示例: /*** 版权申明: 苏州朗动科技有限公司<br>* ...

  7. 企查查接口php版本~

    对接企业三要素验证 税务登记号核验 对接企业三要素验证 接口地址: http://api.qichacha.com/ECIMatch/CompanyVerify 请求头: ps:这里的key和secr ...

  8. mysql查询显示技巧_MYSQL SQL高级查询技巧

    1.UNION,EXCEPT,INTERSECT运算符 A,UNION 运算符 UNION 运算符通过组合其他两个结果表(例如 TABLE1 和 TABLE2)并消去表中任何重复行而派生出一个结果表. ...

  9. java高级查询_SQL高级查询(转载)

    transact---sql高级查询(下) 5:使用having关键字来筛选结果 6:使用compute和compute by子句 7:使用嵌套查询 8:分布式查询 E:使用having关键字来筛选结 ...

最新文章

  1. 阻塞队列与非阻塞队列
  2. 每秒100W请求,12306秒杀业务,架构如何优化?
  3. Xcode 7中http通信出现如下错误
  4. C#中的is、as及转换
  5. vue中的自定义分页插件组件
  6. (网页)JS实现alert中显示换行的方法
  7. Dummary、Fake、Stub、Spy、Mock
  8. python数据处理:数据合并和Reshaping
  9. 我的css reset
  10. 银行mysql面试题_mysql的常见面试题
  11. 使用samtools来对sam/bam/cram相互转换
  12. Pytorch项目(1)| 预测泰坦尼克号船上的生存乘客
  13. 《孙悟空大战白骨精》小游戏
  14. mac下hadoop 2.6.0编译native library
  15. 话题 | 手机充电越充越少,90%的人都遇过这些囧事,有你吗?
  16. qt学习总结之探索Qt的安装目录结构
  17. 问题:未连接到互联网 代理服务器出现问题,或者地址有误。
  18. 阻容感基础05:电容器原理(2)-电容器参数
  19. LayUI可选择可输入下拉框
  20. Python解析m3u8拼接下载mp4视频文件

热门文章

  1. c语言用数字代表字母,使用c语言判断数字字母
  2. dvsdk_4_00_00_22_dm3730 Makefile内容
  3. 【转载】破解物联网落地困境-阿里云硬件接入最佳实践
  4. 用python画篮球场_如何使用 Python 创建一个 NBA 得分图?
  5. 医学图像DICOM文件解析——DICOM内部信息详解篇
  6. 使用环信sdk做一个简单的聊天APP
  7. 用Java语句判断一个数字是不是7的倍数
  8. 汇总:所有你该知道的AR/VR/3D技术与发展
  9. 著名论文 中英文翻译对照
  10. Tecplot 3602015