在互动型网站中常常会受到垃圾贴的困扰。我分享一点个人在垃圾贴处理方面的一点心得:

  要处理垃圾贴必然需要分析垃圾贴的特征
  1. 在内容上垃圾贴通常会带有一个固定域名的外部链接,或者带有QQ号码,手机号码,或者重复内容;
  2. 在发帖频率上有可能是某个用户或者某个IP在短时间内发别多个帖子;
  3. 在手段上高级一点的垃圾贴可能用发贴机,可能会使用不同ip,并附带破解验证码的程序。

  有了特征,我们看下如何对付垃圾贴

  1. 反垃圾贴的最常用的手段就是验证码了
  目前大多数网站的反垃圾机制都使用了验证码,验证码可以阻止部分机器发帖,并加大人工垃圾贴的成本。验证码有好坏之分,好的验证码的表现是不易被破解,或者说破解率很低;好的验证码通常是机器不容易识别而人比较容易识别的,通常都会有扭曲或字符的重叠;相反的一个差的验证码是机器容易识别而人不容易识别的,比如说只有噪点而未做扭曲的验证码。
例如下图中的yahoo的验证码是好的验证码,它充分的扭曲,每个字符的扭曲的角度都不一样,而且每个字符之间有粘连。
 
  举个反例,下面的就是不好的验证码,只做的噪点,每个字符都未做其他处理,破解程序很容易取出噪点分析出正确的结果
  

  2. 通过分析发帖内容中的数字或者外网链接地址和规则来判断发帖是否是垃圾贴。我们可以做一个HttpModule来判断用户的每一个post提交,如果用户提交的内容中有外网地址或者数字,则记录下来这个发帖人的用户id,和ip地址,如果该用户在某个可配置的时间段之内重复提交有相同的数字或相同域名的外网地址,则可以认定该用户有发垃圾贴的嫌疑,并将此嫌疑用户发到监视列表,在该用户发表多于5次(可配置次数)包含疑似广告内容时,就可以拒绝该用户再发帖,并记录日志

  3. 如果是高质量的论坛,可以通过限制注册,申请注册的方式来做一些限制;或者在新用户发表正常内容超过n篇之后才允许用户直接发帖,在通过n篇认定的好帖之前,新用户所发帖子都默认审核后方可显示。

  4. 设置禁用词,对于已经确认为广告的词汇进行封禁。

  5. 购买第三方的组件来做分析处理垃圾贴的工作,这个据说很贵,也有效果。

  如果以上几种方案都使用了,但是你还是没有制止住垃圾贴,我还有一个杀手锏。通过用户发帖的通过率来控制垃圾贴,即根据一个用户发表内容的通过率来决定他的下一个帖子是否可以显示出来,假定我要求通过率在90%以上的用户发帖默认显示出来,那么一个用户要发一个广告贴的代价就是先发9个正常的帖子,这种情况下垃圾贴基本上就可以被遏制住了。

  以上是我个人的一点心得,如果你有更好的方法,请分享。我只写了心得,没有写具体的技术实现,如果哪位有好的技术实现的话欢迎分享。

谈谈互动型网站中垃圾贴的应对方案,互联网营销相关推荐

  1. 10个可爱的外国互动型网站

    下面这10个网站,我相信国内也有差不多的.原文叫Wow! 10 Awesome Interactive Websites,直译就是"哇噻!10个令人惊讶的互动型网站",awesom ...

  2. nofollow标签_nofollow标签在网站中的运用

    ​ 网站优化一定会涉及到代码优化,其中nofollow就是网站优化中最为常用的一个标签,nofollow标签在网站中作用是相当重要的,nofollow标签可以禁止搜索引擎爬行链接,避免权重导出,节省搜 ...

  3. 谈谈如何在面试中发掘程序猿的核心竞争力 什么是程序员的核心竞争力?

    谈谈如何在面试中发掘程序猿的核心竞争力 早两天看了知乎日报的这篇文章<什么是程序员的核心竞争力?>,caoz讲的几点是让我感同身受.这让我联想起了给程序猿的面试,其实也就是通过短暂的接触来 ...

  4. 谈谈互金跟银行里数据逻辑的差异

    要说互金跟银行的不同的地方,先得从最近接触到的一份五级分类表说起来,然后再说说欺诈的指标的区别:最后再讲讲银行跟互金在数据方面的区别. 五级分类 目前国内多数银行.互金根据金融办的相关要求,对资产逾期 ...

  5. 用户在电商网站中购买成功了,那么它在微服务中经历了什么(转)

    面试的时候,面试官问:用户在电商网站中购买成功了,那么它在微服务中经历了什么?你该如何作答? 来源:https://juejin.im/post/5cdfe4a16fb9a07ef63facc3 当我 ...

  6. 关于网站中图片排名优化的技巧是?

    一说到网站的优化工作,大部分的SEOer都会考虑去做网站的页面关键词优化,很多人却忽视图片的优化,更别说图片排名优化.虽然说现在的搜索引擎还不能很好的识别图片,图片站的排名也比较难做,可在实际应用当中 ...

  7. 网站中的个性及风格设计

    一个人拥有自己独特的风格,是一般人所没有的,就会让人注意到那个人的特别,若那个人的风格是正面的,甚至就会引起别人的羡慕与注意,或是赞赏.就如同一个网站,拥有别的网站所没有的风格,就会让浏览者愿意多停留 ...

  8. Android蓝牙串口绘图器,DIY蓝牙模块+processing互动型绘图机械臂(arduino)

    DIY蓝牙模块+processing互动型绘图机械臂(arduino) 江头钓宝宝宝宝 看过论坛里好多大神DIY的绘图机感觉十分过瘾,于是自己也下决心做一个.其实网上关于绘图机的实现方法有很多,有用步 ...

  9. 谈谈关于网页设计中的色彩理论

    谈谈关于网页设计中的色彩理论 设计师在决定了一个网站风格的同时,也决定了网站的情感,而情感的表达很大程度上取决于颜色的选择.颜色是很有力的工具,所有设计师在设计网页时就应该明白这一点. 一.颜色术语 ...

  10. razor html帮助器,在 ASP.NET 网页(Razor)网站中创建和使用帮助器 | Microsoft Docs

    在 ASP.NET 网页(Razor)网站中创建和使用 Helper 02/17/2014 本文内容 本文介绍如何在 ASP.NET 网页(Razor)网站中创建帮助程序. 帮助器是一种可重用的组件, ...

最新文章

  1. 在Linux(ubuntu server)上面安装NodeJS的正确方法
  2. java中随机数Random和ThreadLocalRandom()用法与区别
  3. 泽尼克多项式 matlab,zernike多项式 ---matlab程序 ---arrayfun.m函数
  4. 网易云音乐刷听歌量_「PC端」解锁网易云音乐灰色歌曲,让你听歌不用东跑西跑...
  5. 是不是人老了,子女都不愿和老人相处?
  6. android 动画效果
  7. matlab二值化处理、分形维数和结构占比计算
  8. 软件可靠性测试意义,软件可靠性测试方法与目的
  9. 铲雪车(snow) UVA10203 Snow Clearing 题解
  10. 关于手机上的卫星定位
  11. wifi自动连接,断开连接,打开和关闭,亲测有效
  12. CAD2016 画直线时第二点为相对坐标(相对第一个点的坐标),非绝对坐标
  13. c语言输出法雷序列,法雷(法里)序列 - osc_h0wb1wlt的个人空间 - OSCHINA - 中文开源技术交流社区...
  14. 51单片机烟雾传感器C语言程序,51单片机烟雾报警器制作+程序
  15. BAT文件语法和技巧(bat文件的编写及使用)
  16. Java里模糊查询的英文_MyBatis实现模糊查询的几种方式
  17. 020 MySQL概述及基本操作
  18. 小狼毫自定义短语-Rime-双拼
  19. 阿里巴巴项目P8技术咖总结的Java心得,完整版PDF可下载
  20. sql向数据库表中插入列,sql给表的列添加说明,sql添加主外键约束,增加列,增加字段

热门文章

  1. 拜托,面试别再问我TopK了!!!
  2. 深入解读Linux内存管理系列(总览)
  3. c语言中*在变量的右上角,C语言中变量的声明和定义
  4. 乡镇街道边界数据、行政村边界、省市县区划边界、建筑轮廓边界数据、流域边界数据、降雨量分布、气温分布、道路网分布
  5. 深度学习优化算法大全系列2: Momentum(动量)
  6. scala字符串变量替换
  7. InstantiationException in hadoop map reduce program
  8. 函数的定义与变量作用域
  9. slam十四讲第十讲:找不到 g2o_viewer
  10. android把代码打包成sdk,基于Library去开发android SDK——sdk打包(示例代码)