点击上方“方志朋”,选择“设为星标”

回复”666“获取新整理的面试文章

来源 | oschina.net/p/kk-anti-reptile

kk-anti-reptile是,适用于基于spring-boot开发的分布式系统的反爬虫组件。

系统要求

  • 基于spring-boot开发(spring-boot1.x, spring-boot2.x均可)

  • 需要使用redis

工作流程

kk-anti-reptile使用基于Servlet规范的的Filter对请求进行过滤,在其内部通过spring-boot的扩展点机制,实例化一个Filter,并注入到Spring容器FilterRegistrationBean中,通过Spring注入到Servlet容器中,从而实现对请求的过滤

在kk-anti-reptile的过滤Filter内部,又通过责任链模式,将各种不同的过滤规则织入,并提供抽象接口,可由调用方进行规则扩展

Filter调用则链进行请求过滤,如过滤不通过,则拦截请求,返回状态码509,并输出验证码输入页面,输出验证码正确后,调用过滤规则链对规则进行重置

目前规则链中有如下两个规则

ip-rule

ip-rule通过时间窗口统计当前时间窗口内请求数,小于规定的最大请求数则可通过,否则不通过。时间窗口、最大请求数、ip白名单等均可配置

ua-rule

ua-rule通过判断请求携带的User-Agent,得到操作系统、设备信息、浏览器信息等,可配置各种维度对请求进行过滤

命中规则后

命中爬虫和防盗刷规则后,会阻断请求,并生成接除阻断的验证码,验证码有多种组合方式,如果客户端可以正确输入验证码,则可以继续访问

验证码有中文、英文字母+数字、简单算术三种形式,每种形式又有静态图片和GIF动图两种图片格式,即目前共有如下六种,所有类型的验证码会随机出现,目前技术手段识别难度极高,可有效阻止防止爬虫大规模爬取数据

接入使用

后端接入非常简单,只需要引用kk-anti-reptile的maven依赖,并配置启用kk-anti-reptile即可 加入maven依赖

<dependency><groupId>cn.keking.project</groupId><artifactId>kk-anti-reptile</artifactId><version>1.0.0-SNAPSHOT</version>
</dependency>

配置启用 kk-anti-reptile

anti.reptile.manager.enabled=true

前端需要在统一发送请求的ajax处加入拦截,拦截到请求返回状态码509后弹出一个新页面,并把响应内容转出到页面中,然后向页面中传入后端接口baseUrl参数即可,以使用axios请求为例:

import axios from 'axios';
import {baseUrl} from './config';axios.interceptors.response.use(data => {return data;},error => {if (error.response.status === 509) {let html = error.response.data;let verifyWindow = window.open("","_blank","height=400,width=560");verifyWindow.document.write(html);verifyWindow.document.getElementById("baseUrl").value = baseUrl;}}
);export default axios;

注意

1、apollo-client需启用bootstrap

使用apollo配置中心的用户,由于组件内部用到@ConditionalOnProperty,要在application.properties/bootstrap.properties中加入如下样例配置,(apollo-client需要0.10.0及以上版本)详见apollo bootstrap说明

apollo.bootstrap.enabled = true

2、需要有Redisson连接

如果项目中有用到Redisson,kk-anti-reptile会自动获取RedissonClient实例对象; 如果没用到,需要在配置文件加入如下Redisson连接相关配置

spring.redisson.address=redis://192.168.1.204:6379
spring.redisson.password=xxx

配置一览表

在spring-boot中,所有配置在配置文件都会有自动提示和说明,如下图 :

所有配置都以anti.reptile.manager为前缀,如下为所有配置项及说明

NAME 描述 默认值 示例
enabled 是否启用反爬虫插件 true true
include-urls 需要反爬的接口列表,以'/'开头,以','分隔 /client,/user
ip-rule.enabled 是否启用IP Rule true true
ip-rule.expiration-time 时间窗口长度(ms) 5000 5000
ip-rule.request-max-size 单个时间窗口内,最大请求数 20 20
ip-rule.ignore-ip IP白名单,支持后缀'*'通配,以','分隔 192.168.*,127.0.0.1
ua-rule.enabled 是否启用User-Agent Rule true true
ua-rule.allowed-linux 是否允许Linux系统访问 false false
ua-rule.allowed-mobile 是否允许移动端设备访问 true true
ua-rule.allowed-pc 是否允许移PC设备访问 true true
ua-rule.allowed-iot 是否允许物联网设备访问 false false
ua-rule.allowed-proxy 是否允许代理访问 false false
热门内容:半吊子架构师,一来就想干掉RabbitMQ ...
前、后端分离权限控制设计和实现思路Java 生鲜电商平台 - API 接口设计之 token、timestamp、sign 具体架构与实现面试官:我把数据库部署在Docker容器内,你觉得如何?
炫酷,SpringBoot+Echarts实现用户访问地图可视化(附源码)最近面试BAT,整理一份面试资料《Java面试BAT通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。获取方式:点“在看”,关注公众号并回复 666 领取,更多内容陆续奉上。
明天见(。・ω・。)ノ♡

基于 Spring Cloud 开发的分布式系统,遇到爬虫、接口盗刷怎么办?相关推荐

  1. bootstrap table传回的数据后端怎么获取_基于 Spring Cloud 开发的分布式系统,遇到爬虫、接口盗刷怎么办

    kk-anti-reptile是,适用于基于spring-boot开发的分布式系统的反爬虫组件. 一.系统要求 基于spring-boot开发(spring-boot1.x, spring-boot2 ...

  2. 干货|基于 Spring Cloud 的微服务落地

    转载自 干货|基于 Spring Cloud 的微服务落地 微服务架构模式的核心在于如何识别服务的边界,设计出合理的微服务.但如果要将微服务架构运用到生产项目上,并且能够发挥该架构模式的重要作用,则需 ...

  3. 手写基于Spring Cloud的TCC分布式事务框架

    如何简单实现TCC分布式事务框架 最近听到很多其他公司的小伙伴谈分布式事务的问题,各种业务场景都有,可能就是这两年很多公司都在往微服务发展,现在各个子系统都拆分.建设的差不多了,实现了模块化开发,但是 ...

  4. 分布式 Spring Cloud 基于 Spring Boot 开发一整套

    Spring Boot的工程包括:  - Spring IO Platform:用于版本化应用程序的企业级分发.  - Spring Framework:用于事务管理.依赖注入.数据访问.消息传递和W ...

  5. 基于Spring Cloud微服务化开发平台-Cloud Platform后台管理系统 v3.1.0

    介绍: Cloud-Platform是国内首个基于Spring Cloud微服务化开发平台,具有统一授权.认证后台管理系统,其中包含具备用户管理.资源权限管理.网关API 管理等多个模块,支持多业务系 ...

  6. java路由器开发_基于spring cloud的智能路由

    smart-route 基于spring cloud的智能路由,功能如下 开发模式:优先调用本地服务, order=0 SIT优先:优先调用指定IP服务, order=100 远程调试:远程调试指定服 ...

  7. 基于 Spring Cloud 的服务治理实践

    http://www.infoq.com/cn/articles/spring-cloud-based-service-governance 大家好,我是来自贝壳金控的赵文乐,目前主要从事架构方面的工 ...

  8. 流量暴增,掌门教育如何基于 Spring Cloud Alibaba 构建微服务体系?

    作者 | 童子龙  掌门教育基础架构部架构师 **导读:**本文整理自作者于 2020 年云原生微服务大会上的分享<掌门教育云原生落地实践>,本文主要介绍了掌门教育云原生落地实践,主要围绕 ...

  9. 基于spring cloud 的灰度发布实践_【收藏】基于spring cloud灰度发版方案

    简介 敏捷开发迭代周期短发布快,每周都可能面临版本发版上线,为最大可能的降低对用户的影响提高服务可用率,大部分团队都需要等到半夜做发布和支持.本文就如何基于spring cloud体系做灰度发版改造提 ...

最新文章

  1. GDB 格式化结构体输出
  2. Jmeter之创建Kafka生产者和消费者进行性能测试
  3. maya导入abc动画_三维文件格式知多少 | abc、glTF、fbx、obj、dae、stl、3ds...
  4. css3的自定义字体
  5. 知识工场 | CN-DBpedia 漫游指南
  6. 天梯—输出GPLT(C语言)
  7. 【CV学习笔记】ROI与泛洪填充
  8. html颜色趋势,展望下一年的网页设计配色趋势
  9. java 生成中文字符乱码,java汉字乱码的原因与解决方法
  10. 【常用模块】电容触摸按键模块(原理讲解、STM32实例操作)
  11. 房产中介管理系统搭建
  12. 485通讯测试软件,Modbus 测试工具| Modbus 通信测试软件
  13. ps抠图 淘宝抠图
  14. eclipse mars2 安装web插件
  15. 电商系统的商品库存管理
  16. 计算机应用团队,【计算机应用论文】团队合作学习下计算机应用论文(共3025字)...
  17. 用python输出圣诞树_教你怎样用Python画了一棵圣诞树,赶紧来学习
  18. Hibiscus的脑机接口学习周报(2022/12/26~2022/1/1)
  19. badboy安装及使用
  20. bex5中的常用方法总结

热门文章

  1. input 选择框改变背景小技巧
  2. dp uva1218
  3. stm32F042 (二) 按键触发中断
  4. javaScript 工作必知(三) String .的方法从何而来?
  5. HDU2594 KMP next数组的应用
  6. [POJ2104]K-th Number(区间第k值 记录初始状态)
  7. 四月青少年编程组队学习(图形化四级)Task01
  8. 【直播】李祖贤:集成学习答疑直播之八-- 集成知识点回顾与补充
  9. 【组队学习】【24期】河北邀请赛(二手车价格预测)
  10. 推荐 2个十分好用的 pandas 数据探索分析神器!