如何筛查虚假流量? 如何预防作弊?

知乎问答记录,仅供学习参考

作者:李小喵
链接:https://www.zhihu.com/question/53627544/answer/337003640
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

首先,电脑客户端的广告流量反作弊方案已经非常成熟了,就不多讲了,主要讲一下很多人不太熟悉的移动端的广告反作弊吧(很多第三方移动广告统计平台的计算方式都超级弱,弱到渣渣都不剩,至于原因,自己去体会,毕竟他们只想挣钱)。

1、移动广告作弊通常都包括哪些?

比较常见的是刷量,撞库。

  • 什么是刷量:最常见的是:刷点击,刷激活,刷留存。
  • 什么是撞库:作弊广告渠道商采集了非常多的设备信息,他们会疯狂往对方广告点击日志服务器发送设备点击信息,当激活日志服务器采集到对应设备的激活,就会认为是该作弊渠道商的。逻辑如下图:

2、广告反作弊体系产品

通常我们在设计广告反作弊产品时,会包含两个部分:反作弊策略和历史黑库;
其中历史黑库包含:黑渠道库,黑设备库和黑ip库。

♦第一个:反作弊策略的逻辑:主要基于广告点击频次和频率,加上一些行为规则。

由于移动广告有按点击付费,有按激活付费,有按留存付费,因为反作弊策略也主要是针对这这些方面。

点击反作弊

单设备单渠道点击次数:

  • 5s内单设备,单渠道,点击大于等于2次小于5次,该设备在该渠道的点击标记为异常,激活默认为自然量;点击大于等于5次,该设备在该渠道的点击和激活都标记为异常。
  • 一天内单设备,单渠道,点击大于等于3次小于6次,该设备在该渠道的点击标记为异常,激活默认为自然量;点击大于等于6次,该设备在该渠道的点击和激活都标记为异常。
  • 一周内单设备,单渠道,点击大于等于12次小于15次,该设备在该渠道的点击标记为异常,激活默认为自然量;点击大于等于15次,该设备在该渠道的点击和激活都标记为异常。

单ip单渠道点击次数:

  • 一天内,单ip,单渠道,点击大于等于30次,则该IP下的点击和激活标记为异常。

激活反作弊

单设备单渠道激活次数:

  • 一天内单设备,单渠道,激活app大于等于3次小于5次,该设备在该渠道的点击标记为异常,激活默认为自然量;激活大于等于5次,该设备在该渠道的点击和激活都标记为异常。
  • 一周内单设备,单渠道,激活app大于等于4次小于6次,该设备在该渠道的点击标记为异常,激活默认为自然量;激活大于等于6次,该设备在该渠道的点击和激活都标记为异常。

单ip单渠道激活次数:

  • 一天内,单ip,单渠道,激活大于等于30次,则该IP下超出的点击和激活标记为异常。

点击到激活时间差:

  • 从点击到激活的时间差小于等于5s,该设备在该渠道的点击和激活标记为异常。

♦第二个:历史黑库:利用历史数据建黑库。

黑渠道库:

黑渠道库就是,该渠道的设备只要存在于任何一个渠道的黑设备库里,则该渠道的该设备的点击和激活均为异常。

黑渠道库规则:

  • 3天点击数大于1w,且激活率在0.01%以下的渠道,进入黑渠道库。

黑设备库:

每一个渠道都有一个黑设备库,都需要参与计算。
单天的激活率小于等于某个值使用所有的黑名单库。
单天的激活率大于等于某个值出黑名单库。
单渠道的黑设备,在该渠道未来的点击和激活均标记为异常。

黑设备库规则:

  • 5s内点击3个以上广告链接的设备。
  • 一天内点击5个以上广告链接的设备。
  • 一天内激活3个以上app的设备。
  • 一周内,激活3个以上app的设备,且次日留存均为0。
  • 一周内,激活3个以上app的设备,且7日内,每日使用时长方差小于等于3分钟。
  • 渠道数据设备指纹的唯一性不匹配。

黑ip库:

每一个渠道都有一个黑ip库,都需要参与计算。
单天的激活率小于等于某个值使用黑名单库。
单天的激活率大于等于某个值出黑名单库。
单渠道的黑IP,在该渠道未来的点击和激活均标记为异常。

单渠道的黑IP库规则:

  • 一天内,点击大于等于50次的IP。--50以上ip占比0.47%
  • 一天内,激活大于等于10次的IP。--激活大于10个的仅3个人,可见刷IP点击之多,占比0.054%
  • 一天内,激活app次数/激活设备大于等于2的IP。
  • 一周内,激活5个以上app的ip,且次日留存率均为0。
  • 一周内,激活5个以上app的ip,且7日内,每日使用时长方差小于等于3分钟。

------------------------------------

划重点:以上策略的数据,是做了很多数据调研后的结果,仅做参考,在参考和学习的过程中,需要结合自己公司的真实数据来分析。

------------------------------------

ps,对于90%的公司,基于规则的反作弊已足够(毕竟很多公司连基于规则的反作弊都不会做),对于关于机器学习,idmapping等相关的反作弊,需要很多的积累。

如何用机器学习做广告反作弊(一)相关推荐

  1. 如何用机器学习做广告反作弊(二)

    如何筛查虚假流量? 如何预防作弊? 首先应用场景是什么,广告反作弊的种类很多,简单说几个应用场景: 按平台分:PC.移动,不同的平台玩法不一样: 按照防作弊的时间段分:请求阶段,实时扣费阶段,离线计算 ...

  2. 算法系列 - 广告反作弊概述

    以下所有内容均整理于各种博客 文章目录 一.广告名词解释 二.广告作弊手段 三.广告反作弊规则方案 3.1 用户标识 3.2 用户行为 3.3 广告来源 四.广告反作弊机器学习方案 五.参考文档 一. ...

  3. 【fraud detection】秒针系统发布《互联网广告反作弊技术白皮书》

    中国领先的第三方广告技术公司秒针系统日前发布<互联网广告反作弊技术白皮书>,把点击率异常.IP分布异常.URL/访问者指纹信息(浏览器.操作系统等)异常.点击没有对应的曝光请求.来源异常. ...

  4. 广告反作弊的常用技术分析

    基于IP地址1 来自同一IP地址的多次点击,会被视为一次点击或直接视为作弊而被K掉账号:同一广告点击IP大部分来自同一地理区域,也会被怀疑为作弊. 基于Cookies2 虽然IP不同但是Cookies ...

  5. 网络广告反作弊在线广告作弊手段一览

    广告业有句古老的名言:你知道广告投入的一半都被浪费了,可你不知道究竟是哪一半."这是个最好的时代,也是最坏的时代."这句话用来描述互联网时代广告主们的处境实在是再准确不过了.这里提 ...

  6. 和朋友们一起探道一下CPA广告反作弊方面的技术,欢迎大家发表意见。

    目前最常用的作弊手法就是 1.通过安装在用户电脑上的插件,捆绑注册流程自动在用户不知情的情况下注册,这个一般可以使用高强度的验证码来防止. 2.通过雇佣注册手来注册.这个完完全全是人工操作.而且IP地 ...

  7. 互联网广告作弊与反作弊综述

    一.互联网广告反作弊的意义 互联网行业发展的几十年来,已经渗透到生活的方方面面,各种互联网公司层出不穷.互联网公司的商业变现途径已经发展出引流.电商.游戏等多种流派,但是广告变现作为一种最快捷和直接的 ...

  8. 技术揭秘 | 互联网广告黑产盛行,如何反作弊?

    简介:有人的地方就有江湖.广告作为互联网公司商业变现最为直接快捷的途径,广告作弊已经形成了一个有完整链条的黑产行业.如何通过技术手段识别并防范广告作弊?本文通过介绍常见的广告计费模式和虚假流量的获益形 ...

  9. 部分有关 广告联盟作弊 与反作弊资料收集

    原文:http://www.lvjiyong.com/i356.html 摘要:今天公司网站发现了有用户开始作弊,这属于意外之中的事,广告联盟作弊与反作弊这个永恒的话题,对于广告收受方的盈利简单易懂是 ...

最新文章

  1. PostgreSQL调研
  2. POJ 2728 最优比率生成树
  3. mybatis知识点
  4. [网络安全自学篇] 三十四.Windows系统安全缺陷之5次Shift漏洞启动计算机机理分析
  5. java 面向对象个人理解
  6. 通过OpenShift超越云技术
  7. discuz模板引擎语法
  8. MATLAB通信系统建模与仿真
  9. Esp8266 -- 心知天气get请求及url讲解说明
  10. Helio P10 (MT6755)
  11. 1050ti比1050强多少 gtx1050和gtx1050ti差距大吗
  12. docker 安装mysql8.0并且暴漏外部的连接
  13. 我的世界匠魂钢怎么做
  14. linux卸载集群oracle,Oracle RAC集群卸载步骤
  15. 【android opengles开发的一些基础类】
  16. 什么是编码器、解码器?(CNN\RNN....)
  17. 用java实现的文本编辑器可以媲美windows自带的编辑器吗?(功能全,超详细)
  18. 读博的选择,读博,还是不读博?
  19. O(nlogn)级排序之希尔排序
  20. 自动文摘评测方法:Rouge-L、Rouge-N

热门文章

  1. win10连不上wifi_详解win10笔记本连不上wifi怎么办
  2. [Java] BufferedImage类的相关处理
  3. AMBA AHB介绍
  4. 报表FineReport中单元格角标各种颜色的标识说明
  5. 很简单的数据库关系代数介绍(Relational Algebra)
  6. viewpager2异常: java.lang.IllegalStateException: Fragment no longer exists for key f#1: unique id 8052
  7. java参数错误,参数不匹配错误java.lang.IllegalArgumentException: argument type mismatch
  8. svm 高斯核为什么惩罚项越大_SVM分类器原来这么简单
  9. java基础(for循环):八个for循环案例
  10. java中布局管理器flowlayout_JAVA基础:FlowLayout布局管理器