思考

我们可以基于哪些指标去怀疑流量的真实性?
首先我们需要对网站的流量进行过滤,仅对一家广告商带来的流量进行分析
这是我们以下指标运用的前提。

一、流量的地域来源

通常访问网站的访客会来自各个不同的地理位置。所以在地图覆盖图报告中可以看到很多不同地区的流量来源。
而虚假流量通常很难使用多个地区的不同IP来产生流量。
所以通过地区覆盖图来看,如果流量来源都集中在一个地区,这部分流量就很可疑了。
当然,你广告也有可能只针对某个地区的访客投放,这样的话,访客的地理范围可能就不适用了。
又或者你遇到了更加智能的流量,比如人肉流量,那么你可以尝试使用其它的指标去进行分析。

二、流量的产生时间

这里的时间要分为两个维度,一种是将时间维度拉长,观察全年一个时间线的流量分布。
另外一种将时间精确到每个小时的访问数据,观察24小时的流量分布。
通常,网站正常的访问流量会分布在一天中的各个时段,即使有访问高峰,在分布图中也会是较为平滑的曲线。
而虚假流量是人为控制产生的流量。为节省成本不会在意流量的时间分布,所以会在发现流量突增的情况。
所以,如果流量过于集中在某个时段,或者在某个时段有了不正常的增长。这部分流量就可疑了。
当然也不排除有的程序会计算好日期和时间端,并按时间曲线模拟点击。如果碰到这种“智能流量”的情况,就要使用其它的指标去进行分析。

如图中标注的9月28、29号的流量就很可疑。

三、流量的跳出率

跳出率不仅仅可以反映页面的质量,也可以反映初流量的质量。
在没有进行页面改动的情况下,如果发现某个时间段的跳出率突然增高,那么对那个时间段的流量进行多个指标的综合对比,可能会发现一些可以的情况。

四、流量的网络属性

我们也可以通过流量的网络服务提供商来看出一些东西。
正常情况下,网站访问者的接入方式应该是多样化的,而虚假流量的接入方式就会很单一。
这个指标对于国内的朋友来说可能并不友好(三大运营商几乎垄断了整个行业)
还有就是现在虚假流量发展的非常高级,对于所谓的人肉流量,我们是很难分辨出来的。

五、访问路径

通常我们会制作一个着陆页去承载广告流量,但是访问者来到网站后会有不同的行为,观看不同的信息或者访问不同的板块,并且在不同的页面结束对网站的访问,这些都是虚假流量很难完成的事情,所以,当我们发现流量的访问路径和结束页面基本相同的时候,我们就应该对这部分流量保持怀疑。

六、回访用户

通常情况下,当一定数量的用户来到你的网站后,总会有一部分访问者会进行回访,即使这部分访问者可能很会少。这就像在网站中,有的链接虽然藏得很深,但是总还是会有人去点击它。因此,在分析来自一个渠道的流量时,适当的拉大时间维度来分析回访用户也是辨别虚假流量的一种方法。

七、其它

很多指标也可以帮助我们判断流量的质量,比如:
网站的停留时长,这个指标虽然会受到cookie30分钟生存期的影响,让它看起来并不是那么准确,但是这个指标却与虚假流量的成本有直接的关系,所以也可以起到一定的辅助作用。
业务目标,对于虚假流量来说,业务目标的完成度是一个终结性的指标,特别是需要完成实际购买的业务目标,但是影响业务目标的因素有很多,我们需要综合的去分析。
单页面刷新,单页面刷新的行为可以降低网站的跳出率,这类流量但从跳出率这个指标上来看会觉得表现很好,但是却完全没有更多的交互行为,我们可以通过Pageviews / Unique Pageviews 这个指标去观察这种行为的情况。
点击次数、滚动次数,当我们发现网站的访问时长、跳出率等指标表现情况都很好的时候,却发现点击次数以及滚动次数很低,那么我们应该对一些指标的情况保持怀疑,进行更深一步的分析。
还有我能想到的比如页面的长尾分析着陆页的用户留存线注意力热图等等,都可以帮助我们去判断流量的情况。

八、总结

对于虚假流量的分析,我们要保持对数据敏感性,从多个指标进行综合分析,当发现某一项指标异常的时候,也要思考一下,是否是受到了某一项运营工作的影响。

数据基础——如何辨别虚假流量相关推荐

  1. 数字营销加速进入“下半场”,如何应对虚假流量“顽疾”?

    2020年刚刚过去,尽管新冠肺炎疫情给全球经济消费带来了重大影响,但大数据.物联网.5G等数字技术的发展和应用,仍然给我国数字经济注入了新的发展活力. 在数字化大潮推动之下,数字营销已成为推动企业和品 ...

  2. 免费下载 |《数字广告投放中虚假流量的排查与判定》白皮书重磅发布

    "我在广告上的投入有一半是无用的,但我不知道是哪一半." 20 年前约翰•沃纳梅克(John Wanamaker)的观点揭露业界精准营销的短板,20 年后的今天依旧深刻: 世界广告 ...

  3. hawk大数据基础知识总结(1)

    一.大数据概述 1.1大数据的概念 大数据一共具有三个特征:(1)全样而非抽样:(2)效率而非精确:(3)相关而非因果. (1)在过去由于缺乏获取全体样本的手段,人们发明了"随机调研数据&q ...

  4. 大数据基础——Hadoop大数据平台搭建

    文章目录 前言 Hadoop大数据平台搭建 一.Hadoop原理和功能介绍 二.Hadoop安装部署 三.Hadoop常用操作 总结 前言 分布式机器学习为什么需求大数据呢?随着海量用户数据的积累,单 ...

  5. 大数据基础知识全集,大数据爱好者收藏必备

             目前,市场上的大数据产品太多,但远远低于IAAS的标准化水平,各产品之间的差异还不十分清楚.当许多公司正在制造大数据平台或大数据解决方案时,他们往往不知道选择哪些产品来满足他们的需求 ...

  6. 十目监测:第三方广告监测系统如何识别广告虚假流量?

    虚假流量生于互联网,壮大于互联网,不论是在电商.支付平台.还是O2O.自媒体.广告等行业,都有着它的身影.不同行业的流量作弊形式不同,比如电商对应刷单.刷信誉,而在户外广告行业,则是漏刊.虚假上刊验收 ...

  7. 【数据架构】Netflix 万亿级实时数据基础架构的四个创新阶段

    我叫徐振中.我于 2015 年加入 Netflix,担任实时数据基础架构团队的创始工程师,后来领导了流处理引擎团队.我在 2010 年代初对实时数据产生了兴趣,从那时起我就相信还有很多价值有待发掘. ...

  8. 大数据基础之Hadoop(三)—— MapReduce

    作者:duktig 博客:https://duktig.cn (文章首发) 优秀还努力.愿你付出甘之如饴,所得归于欢喜. 本篇文章源码参看:https://github.com/duktig666/b ...

  9. Ads.txt是虚假流量的终结者么?

    没有一处遗产像诚实那样丰富的了.---莎士比亚 广告行业不诚实的乱象也是相当花簇锦攒,作为双刃剑的技术一方面制造着混乱,另外一方面也不断创新来平复混乱.今天介绍的程序化广告标准的Ads.txt,就是一 ...

最新文章

  1. 基于图像的三维物体重建:在深度学习时代的最新技术和趋势综述之三维曲面解码...
  2. ffmpeg推流_明白了以下5点思路,你也能用Python实现直播推流效果(技术活)
  3. [置顶] ActivityGroup自我堆栈管理(复用现有activity)
  4. selenium在页面中多个fream的定位
  5. STM8L探索套件学习笔记(转)
  6. Tegra3 vSMP架构Android运行时CPU热插拔及高低功耗CPU切换
  7. import引入json文件_关于TypeScript中import JSON的正确姿势详解
  8. 使用httpHandlers进行url rewrite时,提示http 404 error 错误
  9. 【Linux】一步一步学Linux——Linux系统常用快捷键(12) 待更新...
  10. Oracle入门(六)之用户操作
  11. 实验五 网络编程与安全-----实验报告
  12. Java:抽象类笔记
  13. C#正则表达式判断输入日期格式是否正确
  14. Guojiz网址导航系统PHP网站源码
  15. Windows Phone 获取联系人
  16. java操作远端ftp文件失败
  17. 解决win7下Realtek声卡有噪音的问题
  18. AutoCAD2014下载和安装教程(官方中文完整版)
  19. 精细化运营店铺,引导店铺走向正轨,带你玩转淘宝
  20. Linux RPM包安装、卸载和升级(rpm命令)详解

热门文章

  1. Windows系统下php安装扩展mbstring
  2. UE4数字孪生材质(四)
  3. AutoWire(自动装配)
  4. 【MySQL内核系列】Centos7环境MySQL5.7源码编译教程
  5. BM3D的学习与Matlab实现
  6. 荒废了3年多的学渣救赎....差强人意的结果吧
  7. Arduino和蜂鸣器制作简单的音乐播放器
  8. js判断数组中某个元素的个数
  9. vue打包部署后,前端页面刷新后丢失
  10. java调用c传参_JAVA 调用C 语言程序,并且进行传参收结果等操作