一、背景

关于敏感词,设计的过滤与屏蔽的方案我认为有2个方向

  • 一是:我们在写入的时候,对全部的文本进行控制,让敏感词被replaced
  • 二是:我们在展示的时候,对读取的文本进行控制,让敏感词被replaced

目前我是选择的后者,考虑到写入的性能与并发性,不对写入时进行控制
在读取后添加缓存的方式进行提高读的效率

这里就看您的业务对读需求量大,还是写入,自行评估去决策

二、关于 sensitive 与 trie算法

本次使用插件是 sensitive:https://github.com/importcjj/sensitive

其实他内部还是实现的trie算法

基础算法–Trie树

trie,又称前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串。与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串。一般情况下,不是所有的节点都有对应的值,只有叶子节点和部分内部节点所对应的键才有相关的值。 – 维基百科

2.1、配置

首先需要加载他的字典
之前尝试过通过对象存储去加载,对比

【go-zero】go-zero 敏感词过滤 整合 开源过滤敏感词插件 sensitive相关推荐

  1. 过滤:sql、敏感词、html、js、css

    sql 参数过滤 if (!function_exists('sql_filter')) {/*** sql 参数过滤* @param string $str* @return mixed*/func ...

  2. 敏感词过滤之——自定义构建查询词库与快速查询实现

    关于敏感词过滤的一点思考与实践 业务场景 思考与研究 逻辑分析 代码实现(php) 构建敏感词树 分割字符串 敏感词树长分支的递归实现 读取敏感词库 敏感词树的查询 查询实现 调用 测试.分析与总结 ...

  3. php自定义词库简单分词,敏感词替换

    关键词匹配类 <?phpnamespace App\Library;use App\Library\Redis;class SensitiveWordFilter {protected $dic ...

  4. Cris 的 Python 数据分析笔记 05:Pandas 数据读取,索引,切片,计算,列整合,过滤,最值

    Pandas 数据读取,索引,切片,计算,列整合,过滤,最值 文章目录 Pandas 数据读取,索引,切片,计算,列整合,过滤,最值 1. read_csv 函数 2. DataFrame 数据结构的 ...

  5. 【Python】文本文件生成词云图片-单字过滤和任意形状词云和清晰度提高

    [Python]txt文本文件生成词云图片 资源提供 纯方框,无文字 单字过滤 任意形状词云 提高清晰度 完整代码 该程序由pycharm运行,产生的图片文件在项目文件夹内. 资源提供 决胜全面建成小 ...

  6. 检查mysql敏感词_拼多多违禁词怎么查 拼多多敏感词违规词检测

    我们都知道拼 违禁词带来的危害 有违禁词的商品会被下架,店铺极大的概率会被扣分罚款,甚至于职业打假人也会关注这些问题商品,对有违禁词商品进行投诉赔款等事项.所以在店铺运营过程中,对店铺内商品不定时进行 ...

  7. es 时间过滤java,Elasticsearch过滤与聚合的先后顺序java实现

    一.Elasticsearch的聚合 ES的聚合相当于关系型数据库里面的group by,例如查找在性别字段男女人数的多少并且按照人数的多少进行排序,在使用MySQL的时候,可以使用如下的句子 sel ...

  8. 结巴分词完全禁用默认词库(仅使用自定义词库)

    有时候需要使用自定义的词库,不使用默认的词库.比如做敏感词分词时, 完全禁用掉默认词库. jieba 分词里面可以这样处理,通过set_dictionary 来设置自定义词库,从而禁用掉默认词库. i ...

  9. 清华 词向量库_word2vec 构建中文词向量

    词向量作为文本的基本结构--词的模型,以其优越的性能,受到自然语言处理领域研究人员的青睐.良好的词向量可以达到语义相近的词在词向量空间里聚集在一起,这对后续的文本分类,文本聚类等等操作提供了便利,本文 ...

最新文章

  1. 每个即将成为或想成为网络工程师最想看的文章
  2. 计算机基础知识二进步,大学计算机基础学习知识练习进步题(含规范标准答案).doc...
  3. 端计算(9)-android opencv(1)
  4. 29. 栈的push,pop序列
  5. java idea 模块_idea 多模块项目依赖父工程class找不到问题的方法
  6. oracle8修改最大连接数,ORACLE查看并修改最大连接数的具体步骤
  7. SDH光传输设备是什么?SDH设备特点介绍
  8. python oop求三角形面积公式_Python OOP --action()函数
  9. Educational Codeforces Round 117 (Rated for Div. 2) ABCDE
  10. 复习宝典之Spring
  11. 谷歌地图 街景 api_Google使街景在地图中更加突出
  12. 红蓝药丸的选择:大脑在缸中还是颅中?
  13. PHP推荐简单采集微博文章信息自用
  14. 微信支付不靠谱 星巴克喝一杯咖啡被刷掉一千多
  15. 常用icon以及color颜色RGB值和对应颜色效果图
  16. Sencha Touch 做相册
  17. java判断excel格式_Java 设置Excel数据验证
  18. astar不能用了_截图快捷键,手把手教你截屏快捷键Ctrl+Alt+A不能用了怎么办
  19. OPENCV study
  20. 用汇编语言写51单片机程序开头为什么一般都这样:ORG 0000H LJMP MAIN ORG 0030H

热门文章

  1. 199 c 通过函数名字符串调用函数
  2. 今天简单地把vw/vh总结一下
  3. 加密工具GPG入门教程
  4. Mac M1芯片 安装vmware 和ubuntu 以及换源全过程
  5. 2个硬盘离线导致raid崩溃的数据恢复案例
  6. 哈哈,美食是生活的重要组成啊,自己烹调鲍鱼
  7. 抖音限流处理方法和封号原因
  8. HDU 6447 YJJ's Salesman (dp+树状数组+莫干山算法)
  9. 动物识别系统代码python_动物识别系统代码
  10. 堡垒机Windows远程桌面连接服务器黑屏解决