数据基础——如何辨别虚假流量
思考
我们可以基于哪些指标去怀疑流量的真实性?
首先我们需要对网站的流量进行过滤,仅对一家广告商带来的流量进行分析
这是我们以下指标运用的前提。
一、流量的地域来源
通常访问网站的访客会来自各个不同的地理位置。所以在地图覆盖图报告中可以看到很多不同地区的流量来源。
而虚假流量通常很难使用多个地区的不同IP来产生流量。
所以通过地区覆盖图来看,如果流量来源都集中在一个地区,这部分流量就很可疑了。
当然,你广告也有可能只针对某个地区的访客投放,这样的话,访客的地理范围可能就不适用了。
又或者你遇到了更加智能的流量,比如人肉流量,那么你可以尝试使用其它的指标去进行分析。
二、流量的产生时间
这里的时间要分为两个维度,一种是将时间维度拉长,观察全年一个时间线的流量分布。
另外一种将时间精确到每个小时的访问数据,观察24小时的流量分布。
通常,网站正常的访问流量会分布在一天中的各个时段,即使有访问高峰,在分布图中也会是较为平滑的曲线。
而虚假流量是人为控制产生的流量。为节省成本不会在意流量的时间分布,所以会在发现流量突增的情况。
所以,如果流量过于集中在某个时段,或者在某个时段有了不正常的增长。这部分流量就可疑了。
当然也不排除有的程序会计算好日期和时间端,并按时间曲线模拟点击。如果碰到这种“智能流量”的情况,就要使用其它的指标去进行分析。
如图中标注的9月28、29号的流量就很可疑。
三、流量的跳出率
跳出率不仅仅可以反映页面的质量,也可以反映初流量的质量。
在没有进行页面改动的情况下,如果发现某个时间段的跳出率突然增高,那么对那个时间段的流量进行多个指标的综合对比,可能会发现一些可以的情况。
四、流量的网络属性
我们也可以通过流量的网络服务提供商来看出一些东西。
正常情况下,网站访问者的接入方式应该是多样化的,而虚假流量的接入方式就会很单一。
这个指标对于国内的朋友来说可能并不友好(三大运营商几乎垄断了整个行业)
还有就是现在虚假流量发展的非常高级,对于所谓的人肉流量,我们是很难分辨出来的。
五、访问路径
通常我们会制作一个着陆页去承载广告流量,但是访问者来到网站后会有不同的行为,观看不同的信息或者访问不同的板块,并且在不同的页面结束对网站的访问,这些都是虚假流量很难完成的事情,所以,当我们发现流量的访问路径和结束页面基本相同的时候,我们就应该对这部分流量保持怀疑。
六、回访用户
通常情况下,当一定数量的用户来到你的网站后,总会有一部分访问者会进行回访,即使这部分访问者可能很会少。这就像在网站中,有的链接虽然藏得很深,但是总还是会有人去点击它。因此,在分析来自一个渠道的流量时,适当的拉大时间维度来分析回访用户也是辨别虚假流量的一种方法。
七、其它
很多指标也可以帮助我们判断流量的质量,比如:
网站的停留时长,这个指标虽然会受到cookie30分钟生存期的影响,让它看起来并不是那么准确,但是这个指标却与虚假流量的成本有直接的关系,所以也可以起到一定的辅助作用。
业务目标,对于虚假流量来说,业务目标的完成度是一个终结性的指标,特别是需要完成实际购买的业务目标,但是影响业务目标的因素有很多,我们需要综合的去分析。
单页面刷新,单页面刷新的行为可以降低网站的跳出率,这类流量但从跳出率这个指标上来看会觉得表现很好,但是却完全没有更多的交互行为,我们可以通过Pageviews / Unique Pageviews 这个指标去观察这种行为的情况。
点击次数、滚动次数,当我们发现网站的访问时长、跳出率等指标表现情况都很好的时候,却发现点击次数以及滚动次数很低,那么我们应该对一些指标的情况保持怀疑,进行更深一步的分析。
还有我能想到的比如页面的长尾分析、着陆页的用户留存线、注意力热图等等,都可以帮助我们去判断流量的情况。
八、总结
对于虚假流量的分析,我们要保持对数据敏感性,从多个指标进行综合分析,当发现某一项指标异常的时候,也要思考一下,是否是受到了某一项运营工作的影响。
数据基础——如何辨别虚假流量相关推荐
- 数字营销加速进入“下半场”,如何应对虚假流量“顽疾”?
2020年刚刚过去,尽管新冠肺炎疫情给全球经济消费带来了重大影响,但大数据.物联网.5G等数字技术的发展和应用,仍然给我国数字经济注入了新的发展活力. 在数字化大潮推动之下,数字营销已成为推动企业和品 ...
- 免费下载 |《数字广告投放中虚假流量的排查与判定》白皮书重磅发布
"我在广告上的投入有一半是无用的,但我不知道是哪一半." 20 年前约翰•沃纳梅克(John Wanamaker)的观点揭露业界精准营销的短板,20 年后的今天依旧深刻: 世界广告 ...
- hawk大数据基础知识总结(1)
一.大数据概述 1.1大数据的概念 大数据一共具有三个特征:(1)全样而非抽样:(2)效率而非精确:(3)相关而非因果. (1)在过去由于缺乏获取全体样本的手段,人们发明了"随机调研数据&q ...
- 大数据基础——Hadoop大数据平台搭建
文章目录 前言 Hadoop大数据平台搭建 一.Hadoop原理和功能介绍 二.Hadoop安装部署 三.Hadoop常用操作 总结 前言 分布式机器学习为什么需求大数据呢?随着海量用户数据的积累,单 ...
- 大数据基础知识全集,大数据爱好者收藏必备
目前,市场上的大数据产品太多,但远远低于IAAS的标准化水平,各产品之间的差异还不十分清楚.当许多公司正在制造大数据平台或大数据解决方案时,他们往往不知道选择哪些产品来满足他们的需求 ...
- 十目监测:第三方广告监测系统如何识别广告虚假流量?
虚假流量生于互联网,壮大于互联网,不论是在电商.支付平台.还是O2O.自媒体.广告等行业,都有着它的身影.不同行业的流量作弊形式不同,比如电商对应刷单.刷信誉,而在户外广告行业,则是漏刊.虚假上刊验收 ...
- 【数据架构】Netflix 万亿级实时数据基础架构的四个创新阶段
我叫徐振中.我于 2015 年加入 Netflix,担任实时数据基础架构团队的创始工程师,后来领导了流处理引擎团队.我在 2010 年代初对实时数据产生了兴趣,从那时起我就相信还有很多价值有待发掘. ...
- 大数据基础之Hadoop(三)—— MapReduce
作者:duktig 博客:https://duktig.cn (文章首发) 优秀还努力.愿你付出甘之如饴,所得归于欢喜. 本篇文章源码参看:https://github.com/duktig666/b ...
- Ads.txt是虚假流量的终结者么?
没有一处遗产像诚实那样丰富的了.---莎士比亚 广告行业不诚实的乱象也是相当花簇锦攒,作为双刃剑的技术一方面制造着混乱,另外一方面也不断创新来平复混乱.今天介绍的程序化广告标准的Ads.txt,就是一 ...
最新文章
- 基于图像的三维物体重建:在深度学习时代的最新技术和趋势综述之三维曲面解码...
- ffmpeg推流_明白了以下5点思路,你也能用Python实现直播推流效果(技术活)
- [置顶] ActivityGroup自我堆栈管理(复用现有activity)
- selenium在页面中多个fream的定位
- STM8L探索套件学习笔记(转)
- Tegra3 vSMP架构Android运行时CPU热插拔及高低功耗CPU切换
- import引入json文件_关于TypeScript中import JSON的正确姿势详解
- 使用httpHandlers进行url rewrite时,提示http 404 error 错误
- 【Linux】一步一步学Linux——Linux系统常用快捷键(12) 待更新...
- Oracle入门(六)之用户操作
- 实验五 网络编程与安全-----实验报告
- Java:抽象类笔记
- C#正则表达式判断输入日期格式是否正确
- Guojiz网址导航系统PHP网站源码
- Windows Phone 获取联系人
- java操作远端ftp文件失败
- 解决win7下Realtek声卡有噪音的问题
- AutoCAD2014下载和安装教程(官方中文完整版)
- 精细化运营店铺,引导店铺走向正轨,带你玩转淘宝
- Linux RPM包安装、卸载和升级(rpm命令)详解