为什么80%的码农都做不了架构师?>>>   

方案解决目标:对一些黑名单进行过滤处理

                                                                                        function is_spam($text, $file, $split =':', $regex =false){ $handle = fopen($file,'rb'); $contents = fread($handle, filesize($file)); fclose($handle); $lines = explode("n", $contents); $arr = array();foreach($lines as $line){ list($word, $count)= explode($split, $line);if($regex){ $arr[$word]= $count; }else{ $arr[preg_quote($word)]= $count;                                               }} preg_match_all("~".implode('|', array_keys($arr))."~", $text, $matches); $temp = array();foreach($matches[0]as $match){if(!in_array($match, $temp)){ $temp[$match]= $temp[$match]+1;if($temp[$match]>= $arr[$word]) {                    returntrue;                                                                    }            }}returnfalse;    } $file ='spam.txt'; $str ='This string has cat, dog word';if(is_spam($str, $file)) {echo 'this is spam';}else{ echo 'this is not spam';}

输出:

ab:3dog:3cat:2monkey:2

转载于:https://my.oschina.net/rongx/blog/481542

PHP解决方案@黑名单过滤相关推荐

  1. SparkStreaming 实现广告计费系统中在线黑名单过滤实战

    本博文内容主要包括以下内容: 1.在线黑名单过滤实现解析 2.SparkStreaming实现在线黑名单过滤 一.在线黑名单过滤实现解析: 流式处理是现代数据处理的主流,各种电子商务网站,搜索引擎等网 ...

  2. SparkStreaming通过读取文件动态黑名单过滤

    SparkStreaming通过读取文件动态黑名单过滤 定时从blackName中拷贝文件到write文件夹中 public class CopyFile {public static void co ...

  3. 第103课:动手实战联合使用Spark Streaming、Broadcast、Accumulator实现在线黑名单过滤和计数

    第103课:动手实战联合使用Spark Streaming.Broadcast.Accumulator实现在线黑名单过滤和计数 /* 王家林老师授课http://weibo.com/ilovepain ...

  4. 2021-08-08ctf中的上传upload题目.user.ini绕过后缀黑名单过滤(同文件夹下有php文件突破口)

    从SUCTF 2019 CheckIn 浅谈.user.ini的利用 / 2019-08-28 08:59:00 / 转自loong大佬-来自先知社区 <span class="con ...

  5. java,spark实现黑名单过滤

    /** * java,spark实现黑名单过滤 */ public class BlackListFilter {public static void main(String[] args){Spar ...

  6. sparkstreaming的实时黑名单过滤太慢

    官网推荐如下这种方法进行过滤,但是这种方法其实有很大弊端,left out join如果黑名单数据量很大就会很伤,其实真不好. object TransformBlackList {def main( ...

  7. spark_黑名单过滤题目:广告点击数据统计。

    题目:广告点击数据统计. 根据动态生成的黑名单进行过滤,实时统计广告点击流量前三. 背景: 在广告点击计费系统中,我们在线过滤掉黑名单的点击,进而保护广告商的利益,只进行有效的广告点击计费 .或者在防 ...

  8. mysql自动拉入黑名单_利用MySQL实现域名黑名单过滤10W记录1ms匹配

    先说一下这个需求,需要判断某个域名是否在黑名单中.黑名单中的域名一旦设置,其下任何级的域名都认为是在黑名单中. 如黑名单中加入a.com,则a.com.www.a.com.1.2.3.a.com等都算 ...

  9. 生产Spark Streaming 黑名单过滤案例

    测试数据(通过Socket传入): 20180808,zs 20180808,ls 20180808,ww 黑名单列表(生产存在表): zs ls 思路: 1.原始日志可以通过Streaming直接读 ...

最新文章

  1. 【Java爬虫】爬取网页中的内容,提取其中文字
  2. 写代码水平的几个发展阶段
  3. pytest+allure之测试报告本地运行
  4. html中的空格表示
  5. mysql 修改表属主_mysql主从配置实现一主一从读写分离
  6. linux 查看防火墙对应的进程,Linux系统防火墙进程查看的实用方法
  7. 制药企业常用质量管理软件TrackWise概述
  8. java jni 生成_利用javah技术生成jni接口的详细步骤 | 学步园
  9. 谷歌FLASH无法添加保存网站
  10. 实战一个项目后,谈谈 Rust 语言的优点和缺点
  11. 古月居ROS入门21讲——10-12.Publisher和Subscriber的编程实现 话题消息的定义与使用
  12. 【练习赛】2022年高教杯数学建模C题(第一题的第二小问)
  13. 我的小游戏上线海外AppStore完整流程心得
  14. 通过url链接将图片上传oss图片显示不完整问题
  15. 驱动开发:内核层InlineHook挂钩函数
  16. How to deactive Virus scan via view IWFNDCCONFIG
  17. 【patch】CNN中 patch 是什么?patch 在CNN学习训练中是怎么起作用的?
  18. 咕咚要和keep们刚正面,闪电战还是持久战?
  19. 基于MATLAB 2021b的机器学习、深度学习实践应用
  20. win10用一会就蓝屏重启_电脑总是蓝屏重启怎么办

热门文章

  1. python arp扫描_基于python的局域网arp扫描
  2. congratulation的用法_congratulation的用法
  3. Java连接数据库 JDBC
  4. 作业六:图像编码相关概念
  5. {code:-1,error:`QcloudSecretId`不能为空,请确保 SDK 配置已正确初始化}解决方法
  6. jupyter notebook出现cannot import name 'create_prompt_application'问题(Died Kernel)
  7. 学习 JavaScript (四)核心概念:操作符
  8. Confluence 6 数据库表-系统信息(System information)
  9. Oracle执行计划突变诊断之统计信息收集问题
  10. ava.lang.UnsatisfiedLinkError: