如何用机器学习做广告反作弊(一)
如何筛查虚假流量? 如何预防作弊?
知乎问答记录,仅供学习参考
作者:李小喵
链接:https://www.zhihu.com/question/53627544/answer/337003640
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
首先,电脑客户端的广告流量反作弊方案已经非常成熟了,就不多讲了,主要讲一下很多人不太熟悉的移动端的广告反作弊吧(很多第三方移动广告统计平台的计算方式都超级弱,弱到渣渣都不剩,至于原因,自己去体会,毕竟他们只想挣钱)。
1、移动广告作弊通常都包括哪些?
比较常见的是刷量,撞库。
- 什么是刷量:最常见的是:刷点击,刷激活,刷留存。
- 什么是撞库:作弊广告渠道商采集了非常多的设备信息,他们会疯狂往对方广告点击日志服务器发送设备点击信息,当激活日志服务器采集到对应设备的激活,就会认为是该作弊渠道商的。逻辑如下图:
2、广告反作弊体系产品
通常我们在设计广告反作弊产品时,会包含两个部分:反作弊策略和历史黑库;
其中历史黑库包含:黑渠道库,黑设备库和黑ip库。
♦第一个:反作弊策略的逻辑:主要基于广告点击频次和频率,加上一些行为规则。
由于移动广告有按点击付费,有按激活付费,有按留存付费,因为反作弊策略也主要是针对这这些方面。
点击反作弊
单设备单渠道点击次数:
- 5s内单设备,单渠道,点击大于等于2次小于5次,该设备在该渠道的点击标记为异常,激活默认为自然量;点击大于等于5次,该设备在该渠道的点击和激活都标记为异常。
- 一天内单设备,单渠道,点击大于等于3次小于6次,该设备在该渠道的点击标记为异常,激活默认为自然量;点击大于等于6次,该设备在该渠道的点击和激活都标记为异常。
- 一周内单设备,单渠道,点击大于等于12次小于15次,该设备在该渠道的点击标记为异常,激活默认为自然量;点击大于等于15次,该设备在该渠道的点击和激活都标记为异常。
单ip单渠道点击次数:
- 一天内,单ip,单渠道,点击大于等于30次,则该IP下的点击和激活标记为异常。
激活反作弊
单设备单渠道激活次数:
- 一天内单设备,单渠道,激活app大于等于3次小于5次,该设备在该渠道的点击标记为异常,激活默认为自然量;激活大于等于5次,该设备在该渠道的点击和激活都标记为异常。
- 一周内单设备,单渠道,激活app大于等于4次小于6次,该设备在该渠道的点击标记为异常,激活默认为自然量;激活大于等于6次,该设备在该渠道的点击和激活都标记为异常。
单ip单渠道激活次数:
- 一天内,单ip,单渠道,激活大于等于30次,则该IP下超出的点击和激活标记为异常。
点击到激活时间差:
- 从点击到激活的时间差小于等于5s,该设备在该渠道的点击和激活标记为异常。
♦第二个:历史黑库:利用历史数据建黑库。
黑渠道库:
黑渠道库就是,该渠道的设备只要存在于任何一个渠道的黑设备库里,则该渠道的该设备的点击和激活均为异常。
黑渠道库规则:
- 3天点击数大于1w,且激活率在0.01%以下的渠道,进入黑渠道库。
黑设备库:
每一个渠道都有一个黑设备库,都需要参与计算。
单天的激活率小于等于某个值使用所有的黑名单库。
单天的激活率大于等于某个值出黑名单库。
单渠道的黑设备,在该渠道未来的点击和激活均标记为异常。
黑设备库规则:
- 5s内点击3个以上广告链接的设备。
- 一天内点击5个以上广告链接的设备。
- 一天内激活3个以上app的设备。
- 一周内,激活3个以上app的设备,且次日留存均为0。
- 一周内,激活3个以上app的设备,且7日内,每日使用时长方差小于等于3分钟。
- 渠道数据设备指纹的唯一性不匹配。
黑ip库:
每一个渠道都有一个黑ip库,都需要参与计算。
单天的激活率小于等于某个值使用黑名单库。
单天的激活率大于等于某个值出黑名单库。
单渠道的黑IP,在该渠道未来的点击和激活均标记为异常。
单渠道的黑IP库规则:
- 一天内,点击大于等于50次的IP。--50以上ip占比0.47%
- 一天内,激活大于等于10次的IP。--激活大于10个的仅3个人,可见刷IP点击之多,占比0.054%
- 一天内,激活app次数/激活设备大于等于2的IP。
- 一周内,激活5个以上app的ip,且次日留存率均为0。
- 一周内,激活5个以上app的ip,且7日内,每日使用时长方差小于等于3分钟。
------------------------------------
划重点:以上策略的数据,是做了很多数据调研后的结果,仅做参考,在参考和学习的过程中,需要结合自己公司的真实数据来分析。
------------------------------------
ps,对于90%的公司,基于规则的反作弊已足够(毕竟很多公司连基于规则的反作弊都不会做),对于关于机器学习,idmapping等相关的反作弊,需要很多的积累。
如何用机器学习做广告反作弊(一)相关推荐
- 如何用机器学习做广告反作弊(二)
如何筛查虚假流量? 如何预防作弊? 首先应用场景是什么,广告反作弊的种类很多,简单说几个应用场景: 按平台分:PC.移动,不同的平台玩法不一样: 按照防作弊的时间段分:请求阶段,实时扣费阶段,离线计算 ...
- 算法系列 - 广告反作弊概述
以下所有内容均整理于各种博客 文章目录 一.广告名词解释 二.广告作弊手段 三.广告反作弊规则方案 3.1 用户标识 3.2 用户行为 3.3 广告来源 四.广告反作弊机器学习方案 五.参考文档 一. ...
- 【fraud detection】秒针系统发布《互联网广告反作弊技术白皮书》
中国领先的第三方广告技术公司秒针系统日前发布<互联网广告反作弊技术白皮书>,把点击率异常.IP分布异常.URL/访问者指纹信息(浏览器.操作系统等)异常.点击没有对应的曝光请求.来源异常. ...
- 广告反作弊的常用技术分析
基于IP地址1 来自同一IP地址的多次点击,会被视为一次点击或直接视为作弊而被K掉账号:同一广告点击IP大部分来自同一地理区域,也会被怀疑为作弊. 基于Cookies2 虽然IP不同但是Cookies ...
- 网络广告反作弊在线广告作弊手段一览
广告业有句古老的名言:你知道广告投入的一半都被浪费了,可你不知道究竟是哪一半."这是个最好的时代,也是最坏的时代."这句话用来描述互联网时代广告主们的处境实在是再准确不过了.这里提 ...
- 和朋友们一起探道一下CPA广告反作弊方面的技术,欢迎大家发表意见。
目前最常用的作弊手法就是 1.通过安装在用户电脑上的插件,捆绑注册流程自动在用户不知情的情况下注册,这个一般可以使用高强度的验证码来防止. 2.通过雇佣注册手来注册.这个完完全全是人工操作.而且IP地 ...
- 互联网广告作弊与反作弊综述
一.互联网广告反作弊的意义 互联网行业发展的几十年来,已经渗透到生活的方方面面,各种互联网公司层出不穷.互联网公司的商业变现途径已经发展出引流.电商.游戏等多种流派,但是广告变现作为一种最快捷和直接的 ...
- 技术揭秘 | 互联网广告黑产盛行,如何反作弊?
简介:有人的地方就有江湖.广告作为互联网公司商业变现最为直接快捷的途径,广告作弊已经形成了一个有完整链条的黑产行业.如何通过技术手段识别并防范广告作弊?本文通过介绍常见的广告计费模式和虚假流量的获益形 ...
- 部分有关 广告联盟作弊 与反作弊资料收集
原文:http://www.lvjiyong.com/i356.html 摘要:今天公司网站发现了有用户开始作弊,这属于意外之中的事,广告联盟作弊与反作弊这个永恒的话题,对于广告收受方的盈利简单易懂是 ...
最新文章
- PostgreSQL调研
- POJ 2728 最优比率生成树
- mybatis知识点
- [网络安全自学篇] 三十四.Windows系统安全缺陷之5次Shift漏洞启动计算机机理分析
- java 面向对象个人理解
- 通过OpenShift超越云技术
- discuz模板引擎语法
- MATLAB通信系统建模与仿真
- Esp8266 -- 心知天气get请求及url讲解说明
- Helio P10 (MT6755)
- 1050ti比1050强多少 gtx1050和gtx1050ti差距大吗
- docker 安装mysql8.0并且暴漏外部的连接
- 我的世界匠魂钢怎么做
- linux卸载集群oracle,Oracle RAC集群卸载步骤
- 【android opengles开发的一些基础类】
- 什么是编码器、解码器?(CNN\RNN....)
- 用java实现的文本编辑器可以媲美windows自带的编辑器吗?(功能全,超详细)
- 读博的选择,读博,还是不读博?
- O(nlogn)级排序之希尔排序
- 自动文摘评测方法:Rouge-L、Rouge-N
热门文章
- win10连不上wifi_详解win10笔记本连不上wifi怎么办
- [Java] BufferedImage类的相关处理
- AMBA AHB介绍
- 报表FineReport中单元格角标各种颜色的标识说明
- 很简单的数据库关系代数介绍(Relational Algebra)
- viewpager2异常: java.lang.IllegalStateException: Fragment no longer exists for key f#1: unique id 8052
- java参数错误,参数不匹配错误java.lang.IllegalArgumentException: argument type mismatch
- svm 高斯核为什么惩罚项越大_SVM分类器原来这么简单
- java基础(for循环):八个for循环案例
- java中布局管理器flowlayout_JAVA基础:FlowLayout布局管理器