做网站的同学都有一个共同的苦恼:就是自己辛辛苦苦经营的网站,如果内容中涉及色情、暴恐涉政、恶意推广、辱骂、违反广告法、涉及违禁品等文本内容,小则被搜索引擎处罚,严重的可能还会被请去喝茶。还有很多企业站因为编辑的不小心(有些词防不胜防),网页中使用了广告违禁词,可能会被竞争对手投诉到工商等部门,可能会面临关站、整改、罚款等处罚。

这样的例子屡见不鲜,百度去搜一下一大堆。

企业网站被投诉违反广告违禁词案例

很多站长因此而头疼,目前网上能找到网站敏感词检测和广告违禁词查询的工具都是基于单网页或者单页面内容的,例如你的某一篇文章。对于有成千上万内容的网站检测起来就很麻烦了,总不可能一篇一篇复制过去检测吧。

前几天看到大神玉米同学写了一个全站违禁词检测查询的python脚本,使用以后发现了一些小问题,例如可能把网站上的图片当做一个内容页面去检测,这样会消耗更多网站的资源。就随手修改了一哈:只检测html文件或者目录,另外在过滤词库新增了18000余条色情、暴恐涉政、恶意推广、辱骂、违禁品等敏感词,实现不仅仅查询广告违禁词的功能。只保存有违禁词页面URL方便查询。

本脚本只有两个文件:1、filter.txt(过滤词库,你可以根据自己的需求去增加词库; 2、main.py(主程序)。使用方法如下:

网站全站敏感词检测、广告违禁词查询脚本使用方法:

提示:此脚本是基于python3.X。

1、把main.py主程序中的域名修改成你要查询网站的域名,然后保存。

全站敏感词检测、广告违禁词查询使用方法:1、修改域名

2、运行这个脚本。(怎么运行,请到百度搜python或者自行脑补,提示缺py库的请自行pip install)。

全站敏感词检测、广告违禁词查询使用方法:2、运行脚本

3、程序会自动爬取你网站的所有连接,并提示哪个页面命中某个违禁词,最后会在程序运行目录下生成一个ok.csv文件。此文件详细记录了你网站的哪个页面有哪些违禁词。你可以根据这个上面的记录去修改相应的内容。

全站敏感词检测、广告违禁词查询结果

是不是很简单呢?当然这个检测查询脚本也只是给各位站长一个提示和预警,全面检测自己网站上面到底有哪些敏感词和广告违禁词,以便及时调整内容,避免遭到损失。最后放出此下载地址。解压缩即可运行。

python过滤违禁词_网站全站敏感词检测、广告违禁词查询很简单,一个python脚本轻松搞定...相关推荐

  1. 共享会话怎么设置没访问自动断开_云共享文档这种小事,何必专业NAS出手?蒲公英X1轻松搞定...

    前段时间出差,到了目的地之后才发现,辛辛苦苦准备了好几天的资料,拷到移动硬盘里之后,居然忘记放到公文包里了,让同事帮着一看,还在办公桌上.幸好没丢在路上,又麻烦同事帮我把资料打包之后传给了我.回来之后 ...

  2. mfc让图片与按钮一起_微信朋友圈发图片还能添加语音,简单两步就能搞定!今天学到了...

    大家好,我是分享科技小达人~ 今天跟大家探讨的问题是:[微信朋友圈发图片添加语音的方法]. 日常生活中,我们都喜欢发朋友圈,今天就来教你如何在微信朋友圈,发送带语音的图片,方法非常简单,一起来学习一下 ...

  3. 网线重新插拔后恢复正常_生活小窍门之网线不够长怎么办,毕亚兹网线连接器轻松搞定...

    很多朋友在家中装修完时候,为了整齐和方便收纳都会把每个屋中的网口和光纤输出口集中到一起,放置到网络箱中,看起来更加整齐划一,但是装修时都不会考虑到网线要预留很长,很多时候都只留了很短的一节网线,还有的 ...

  4. dropdownlist三级联动怎么实现_简单三步,轻松搞定一级、二级、三级下拉菜单

    工作中,为了录入数据方便,数据规范,我们经常采用下拉菜单来制作规范模板,今天,技巧君和大家分享一下一级.二级和三级联动下拉菜单制作方法,文末有示例文件下载方法哦! 下拉菜单示例 一级下拉菜单 一级下拉 ...

  5. gwr模型用什么做_虎钳的三维模型制作你会吗?用UG软件来做这个轻松搞定

    虎钳作为机加工行业中最频繁出现的夹具,相信大家一定都不陌生,用的次数估计也不少,那么你了解UG是怎么做出虎钳模型的吗? 今天就带大家来看看虎钳模型是怎么用UG做出来的,赶紧学习起来吧! 建模过程: 一 ...

  6. 如何阻止华为杀应用_华为手机“杀”后台严重受不了?别慌,这些小技巧就能轻松搞定...

    原标题:华为手机"杀"后台严重受不了?别慌,这些小技巧就能轻松搞定 现在有越来越多的小伙伴喜欢使用华为手机,觉得其性价比非常高.但是不少使用华为手机的朋友会发现,华为手机" ...

  7. pythonr语言三种基本结构_如何轻松搞定数据科学面试:Python&R语言篇

    作者: Carson Forter 编译: Mika本文为 CDA 数据分析师原创作品,转载需授权 对于数据科学家来说,工作的一大部分都需要在交互式编程环境中对数据进行处理.分析和可视化. 在过去几年 ...

  8. 图片转svg标注_两个免费网站轻松搞定图片文件压缩转化!

    关注· 点击蓝字,关注我吧 图片压缩 文件转格式 两个免费网站轻松搞定 免费处理图片文字网站 前几天做公号的时候,上传图片遇到了图片过大无法上传的问题.这两个网站可以看做是兄弟俩,今天推荐给大家,省去 ...

  9. python pdf转word 表格_太赞了!Pdf转Word,我用Python 轻松搞定表格和水印!

    原标题:太赞了!Pdf转Word,我用Python 轻松搞定表格和水印! 继上一次为大家推出了将pdf转word之后(卧槽!Pdf转Word用Python轻松搞定!),引起了大家的热烈讨论,我也总结了 ...

  10. 网站后台没有提示声怎么办_收藏 | 没有 PS 怎么办?10个在线作图网站,轻松搞定图片设计...

    求职技巧 | 职业技能 | 通关考试,关注公众号:职域go Photoshop 已经成为大多数工作需要用到的工具,很多时候我们都要用到它来满足一些简单的排版.图片处理.尺寸调整或者是做一些简单的效果. ...

最新文章

  1. Microsoft.Data.ConnectionUI.DataConnectionDialog
  2. pickle,json ;random,shelve
  3. UVa11809 - Floating-Point Numbers
  4. 串行 spi Flash 跨页编程的注意点
  5. 经验总结:按需加载JS和css
  6. oracle 12 问题:需要 Oracle 客户端软件 8.1.7 或更高版本
  7. 微信小程序需要https后台的创业机会思考
  8. linux系统wget、curl终端命令行获取公网ip地址及其他网络信息
  9. java rdd hashmap_利用Spark Rdd生成Hfile直接导入到Hbase详解
  10. 紧急!你用的是这20家 VPS 吗?它们疑似马上要携款跑路!
  11. 如果知道它们的热量,还想点吗?
  12. 全面理解ThreadLocal
  13. 什么是订单管理系统OMS
  14. 用matlab实现快速傅里叶变换的源程序,matlab快速傅里叶变换(三个matlab程序介绍)...
  15. Ansys 2021中英文切换、背景切换
  16. pythyon爬虫实现12306查票
  17. 输入法不见了,咋办?输入法不能开机启动咋办?
  18. Python数据结构之算法引入
  19. Android百度地图API使用教程
  20. 跳槽重回前公司?当初的离职原因没解决,早晚还得辞职

热门文章

  1. Web前端工程师VS前端工程师,谁的薪资更上一筹?
  2. 原生开发什么意思_原生App是什么意思
  3. 开源无线管理软件_开源无线电系统向育空地区及其他地区提供紧急警报和音乐
  4. 希腊字母在数学或物理中代表的意思各是什么
  5. 怎样在视频上加字幕,分享视频添加字幕的小技巧
  6. layui中关于重置按钮不起作用的提醒
  7. html div边框添加文字,css通过text-shadow给文字加边框!
  8. mysql查询分数前三个_MySQL中查询获取每个班级成绩前三名的学生信息
  9. 读书笔记5.1——《让数字说话:审计,就这么简单》:孙含晖
  10. 给系统闹钟设置时间Alarm