国税总局的发票查验平台近期JS更新频繁,之前写了一篇验证码识别的文章:https://blog.csdn.net/kerlomz/article/details/105974823
有不少人私信我,问我怎么获取验证码,没想到各位竟然栽在前一步,下面我给大家介绍一个比较简单的办法吧。

pypi仓库里有一个 https://pypi.org/project/invoice-captcha/ 项目
封装了请求的加密参数和返回的解密参数,具体使用方法请看下面的讲解:

首先搬运一下官网的示例代码:

  1. 调用示例:

    import requests
    from invoice_captcha.utils import get_captcha_params, parse_captcha_resp, kill_captcha_fast, uaCAPTCHA_URL = "https://fpcy.guangdong.chinatax.gov.cn/NWebQuery/yzmQuery"# 发票代码
    key1 = "011111111111"
    # 发票号码
    key2 = "11111111"# # 开票日期
    # key3 = "20200603"
    # # 校验码或发票金额
    # key4 = "000000"def fetch_captcha(invoice_code, invoice_no):sess = requests.Session()# 使用代理,需要自备代理# sess.proxies = proxysess.headers = {"User-Agent": ua.random}# 获取验证码请求参数payload = get_captcha_params(invoice_code=invoice_code, invoice_no=invoice_no)# 通过官网获取验证码r = sess.get(CAPTCHA_URL, params=payload)# 验证码请求参数解密plain_dict = parse_captcha_resp(r)# 验证码请求返回明文# key1 图片base64# key4 验证码需要识别的颜色代码print("解密参数 --- ", plain_dict)# 调用识别测试接口captcha_text = kill_captcha_fast(plain_dict, # 默认API有使用次数限制,可联系作者QQ:27009583,测试独立接口# api="http://kerlomz-ac86u.asuscomm.com:19811/captcha/v1")# 输出识别结果print("识别结果 --- ", captcha_text)if __name__ == '__main__':for i in range(10):fetch_captcha(key1, key2)
    

经过剖析,这个sdk分为两个部分,一个是用于获取验证码的参数生成函数get_captcha_params(),另一个是用于解析官网返回的加密报文的函数parse_captcha_resp(),笔者发现,请求参数和解析报文的函数共享了一个now_time变量,这意味这该项目不支持多线程并发,但用于一般的研究学习使用应该是足够了。kill_captcha_fast()对接了一个测试接口,这个接口可以变更,方便使用者自己修改。笔者后面将开辟一篇专门讲解JS的文章,敬请留意。

【2020.06】国税总局发票查验平台验证码最新获取方法相关推荐

  1. 国税总局发票查验平台验证码识别方案,识别率达98%

    全国增值税发票查验平台验证码 2020.04.30 已经同步更新,测试网址不变 手动置顶:验证码识别测试页面(可视化操作) 识别率97.5%,图片接口支持手动测试,以图片形式返回结果:文本接口需要联系 ...

  2. 国税总局增值税发票查验平台验证码识别深度学习实战

    国家税务总局全国增值税发票查验平台验证码 查验验证码图片如下面所示: 测试地址:http://47.99.174.98:8808/ 1.验证码识别Python版 import base64 impor ...

  3. JS逆向——国税总局发票查验平台

    国家税务总局全国增值税发票查验平台 https://inv-veri.chinatax.gov.cn/ 最近朋友有个新需求,就是做一个发票校验的爬虫,由于这个网站有一些不是很友好的反爬,导致对新手的非 ...

  4. 国税总局发票查验平台——Excel批量查验自动截图保存助手

    唠嗑一下 这个项目本身是在今年一月份已经开发完毕的了,奈何开发完成之后深圳合作伙伴却跑路了,emmm.导致后续无限延期- 后面就彻底放下了.不进行开发了,不过这一年期间,实在是太多人找我了,web的已 ...

  5. 发票查验平台验证码识别

    国*税*局发票查验平台https://inv-veri.chinatax.gov.cn/, 验证码识别接口测试, 为了防止恶意使用, 每天限制接口调用次数为500 验证码须是原图, 不能从网页截图, ...

  6. 国税局发票查验中英文验证码识别最新版,识别率99.9%

    采用深度学习进行发票查验验证码模型的训练,在我电脑上模型训练的环境如下: 显卡:RTX 2080TI tensorflow-gpu:2.5.3 1 训练集和测试集的准备 发票查验的验证码分为4种类型, ...

  7. 【全电发票】国家税务总局发票查验平台升级了,支持全电发票

    年前,国家税务总局发票查验平台升级了,支持全电发票! 一.什么是全电发票? 1. 全电发票定义 全电发票,目前主要包括电子发票(增值税专用发票).电子发票(普通发票),是全面数字化的发票,是与纸质发票 ...

  8. 逆向工程Python爬虫——国税局发票查验平台

    前言 这是一篇含金量很高的干货文章,笔者将手把手带领各位一步一步地实现爬取国家税务总局全国增值税发票查验平台(以下简称"查验平台").这个想法诞生在19年初,当时在做一款通过扫描二 ...

  9. 国税局发票查验中英文验证码识别,识别率95.2%

    关于国税局发票验证码识别,应该是大多数从事发票查验的人员比较头疼的问题,但实际上发票验证码识别问题严格而言较为简单. 一.背景 首先,需要了解清楚国税局的发票验证码构成,如下图,正常而言都是中文.数字 ...

最新文章

  1. Outlook接收qq的邮件
  2. Windows客户端C/C++编程规范“建议”——宏
  3. HALCON查找圆心
  4. [caffe] 数据制作和训练
  5. 如何零基础入门FPGA?这篇文章让你吃透!
  6. linux 修改时区_教你在Centos8中更改时区
  7. 1910101811-2
  8. dubbo 相关面试题 有用
  9. 第二章.JSP/Servlet及相关技术详解
  10. 代码实现自动剪辑视频
  11. android调用webservice,Android开发调用WebService的方法示例
  12. team多网卡绑定、桥接的搭建、tcpdump抓包
  13. 如何彻底删除小黑记事本弹窗
  14. 网站域名过户查询_域名知识问答之域名过户
  15. 导出文件(图片、图片集)
  16. PD协议芯片,20W45WPD快充方案
  17. Android项目:基于Android的手机音乐播放器的设计
  18. 设置iPhone的呼叫转移来电等待
  19. 浅谈IT服务与服务管理
  20. 明明价格下降了,为什么你却花了更多钱?

热门文章

  1. Quick #UE4 Tip (第3周 2020.4.10)
  2. JavaScript简介及JavaScript中的关键保留字、变量和数据类型
  3. MapReduce系列之MapReduce的输入
  4. 手把手教你安装 Fedora
  5. 计算机视觉方向就业怎么样?可以做什么?
  6. pLC支持C语言编程执行复杂控制,能够实现多种工作方式的plc控制系统的编程
  7. 关于windows清理C盘问题
  8. Navicat for MySQL 12破解
  9. 2019-9-2-自动机
  10. TCP/IP 协议详解内容总结