在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。本文主要针对“点击率”这一因素进行分析,与大家分享。

本文为Rambo同学以项目分析的架构,从多维度展开分析。全文共4000+字,建议收藏。

P1 分析背景及目的

这是一份淘宝平台的广告展示/点击数据,本次分析需要从这些数据中发现某些规律或者异常,进而给运营团队提出建议。

评价一个广告效果的指标就是广告的点击人数,可以反映一个广告有多少人愿意点击查看广告的内容,只有广告被点击,后续转化为购买行为才会发生。

把广告的点击人数指标拆分:

广告点击人数=广告展示数 x 点击率

而广告展示数又由广告商品的价格、类别影响;不同人群对不同类别商品有着不同的喜好,从而影响广告的点击率。

在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。

因此本次分析就针对【点击率】这一因素进行分析

P2 分析思路

从“广告”和“用户”两个角度进行分析:

1.广告角度

分析不同广告的商品价格对点击率的影响

分析哪些类别的广告点击率更高,哪些类别的点击率低

2.用户角度

分析性别和广告点击率有什么关系

结合聚类分析与RFM模型分析用户群体对广告点击率有什么关系

P3 分析过程

数据清洗

1、数据概览

原始的数据集中包括三类数据,具体数据对应属性如下:

为了方便分析,抽取其中的部分字段作为分析。

  • 从raw_sample数据集中抽取:用户ID、广告ID、是否点击
  • 从ad_feature数据集中抽取:广告ID、类目ID、广告商品价格
  • 从user_profile数据集中抽取:用户ID、年龄层、性别、购物层次

2、数据组合

将三张数据表,组合到一张表中

a=raw_sample.merge(right=ad_feature,on='ad_id',how='left')

b=a.merge(right=user_profile,on='user_id',how='left')

得到一张记录了用户-广告信息表

3、缺失值处理

3.1 源数据中还有许多的缺失值,将性别和年龄层字段中为空值的记录删去

3.2 异常值处理

查看广告商品价格字段的属性值范围:

还是存在数据值过大的异常值,为了方便分析对价格字段进行切分,选取更贴近日常生活的价格在1000元以内的广告记录进行分析

切片之后仍保留了751570条记录

4、数据字段整合

对于广告商品价格字段,每个广告的商品都有各自的价格,根据价格字段不便于进行统计。新增一个字段“price_class”代表价格的区间。

(0-价格在0-100元、1-100-200元、2-200-300元...)

结合图表分析

1、分析不同广告商品价格对点击率的影响

①将广告商品价格分类

将广告按价格分为100元以下、200元以下、300元以下等10类,并计算不同价格区间中广告的点击率情况。


从图中发现,所有价格区间商品的点击率都在5%左右,其中广告商品价格在100元以下的广告点击率最高,为5.92%;看到价格较低的广告商品点击率更高,我们一般认为是对价格敏感的浅层用户(免费用户)在这方面的点击率更高,而拥有一定消费行为和消费意识的中层、深层用户(付费用户)则更在意购物时的体验以及商品的质量。

为了验证以上说法,我们先假设100元以内的广告商品主要的点击对象是浅层用户,再通过数据验证。

② 分析100元以内广告商品点击率的用户组成

查看点击了100元以内的广告商品的用户的用户组成

从用户分布可以看出,在点击了100元以内广告商品的用户中,深度用户的比例更高,占比81.6%,而浅层用户的占比则相对少很多。这推翻了我们原来的假设。

小结:17年5月6日至17年5月12日这8天里的广告点击率理想,但由于缺乏去年同期、今年上月的数据,不足以判断5%左右的广告点击率是否是一个正常水平,有待更多数据验证。

低价广告商品点击率更高,且点击用户中绝大多数是深度用户。建议:可以把这个数据反应给广告投放部门,在这个区域优先投放广告,既可以对浅层用户进行流量变现又能让广告让更多具有消费意愿的中、深层用户看见。

2、分析哪些类别的广告点击率更高,哪些类别的点击率低

由于广告的类别数量众多,大部分类别的广告只有1-2次的展示,数据样本太小,因此选取展示数量最多的7个类别进行分析。
① 找出展示数、点击数、点击率最高的广告类别

可以看出类别6261广告的展示数、点击数、点击率均为最高,而类别4385广告的展示数虽然有10000+,但是点击数、点击率却是最低的。

② 分析类别4385广告效果最差的原因:

a.先按【广告商品价格】来分析计算没有被点击的类别4385广告的商品的平均价格

而点击了类别4385广告的商品的平均价格为:

两者平均价格都在200-300区间、差异不大。结合分析(1),价格区间在200-300的广告商品点击率平均是在5.29%,而类别4385则只有3.61%。

这说明:广告商品价格不是影响类别4385广告点击率的因素

b.再按【性别】来分析

先来看看类别4385被哪些用户看到了

可以看出,类别4385的广告,主要是被推荐给了男性用户,而男性用户对这类商品的兴趣大于女性。

并且女性对这类商品的广告兴趣不高,点击率只有2.75%,是造成类别4385广告点击率低的主要原因。

c.最后按【用户年龄】来分析

来看看不同年龄段、不同性别的用户点击率有什么差异


(年龄字段含义:0:10岁以下、1:10-20岁、2:20-30岁、3:30-40岁、4:40-50岁、5:50-60岁、6:60岁以上)

从统计的数据可以看出,类别4385广告的商品主要点击群体是30岁以上男性用户,尤其是60岁以上男性兴趣最高,而女性用户对这类广告商品兴趣低。

结合a、b的分析,受30岁以上男性欢迎、价格在200-300的商品,推测是西装、皮鞋类或者烟酒类又或者是家用电器类商品

③ 小结

类别6261广告效果最好,有最高的点击率、展示数和点击人数。可以加大对该类别广告的资源投入,扩大广告推广效果。

类别4385广告点击率的原因是,这类商品对女性用户而言兴趣不大,女性用户点击率低,导致了整体的点击率低。可以在该广告的广告词中加入“父亲、爷爷”等宣传词,引导女性消费者将该类别商品作为一种礼物送给男性用户,从而提高点击率

类别4385的主要受众群体是30岁以上男性,为了提高点击率可以重点推荐给30岁以上男性用户。对于该类别广告商品的受众,可以适当增加产品折扣、降低商品价格,吸引点击广告的用户转换成购买用户

3、分析性别和广告点击率有什么关系

① 计算男女人数比例

男女比例约为:1:1.6

② 计算男女各自的点击数

男女广告点击数的比例约为:1:1.7

因此,总体上女性的点击数要多于男性,但两者的点击率基本一致。

③ 比较各类别广告点击率-男女差异


可以看出,大部分类别中,女性的广告点击数都要明显大于男性的点击人数。

只有类别4385、类别4505,这两个类别的广告,男性的点击人数要超过女性的点击人数。

男女之间的主要差异是由类型6261的广告造成的,女性的点击数大约是男性的4倍。

④ 小结

总体上看,女性的广告点击人数明显大于男性,但两者的点击率却是差不多的。

类别4385、4505广告,男性的点击人数要多于女性。这类广告可能是男士服饰、汽车、烟酒这类商品

4、分析用户群体对广告点击率有什么关系

不同的用户群体之间用户价值与消费习惯具有一定的差异,对于不同用户群体的广告投放的策略也不同。通过分析不同用户群体对广告点击率有什么关系,来制定不同的投放策略。

这里的分析通过K-Means算法来对用户进行聚类,并基于RFM模型来对用户价值进行划分。

用K-Means算法对用户进行聚类

这里选取用户的购物层次、广告点击率、浏览广告的商品平均价格,这3个指标来作为判断用户价值的标准

用户的购物层次——体现用户在平台上的持续购物深度

广告点击率——体现用户对广告的接受程度

浏览广告的商品平均价格——体现用户通过广告推广能带来的潜在收益

对用户进行聚类分析:

这里将所有用户分成5类,来代表用户价值的高低。

注:三个特征在聚类时都进行了特征的标准化

从不同群体的特征分布可以得出:

群体5在点击率方面最大

群体2在浏览广告的商品平均价格最大

所有群体的用户在购物层次上基本没有差异

因此,我们可以出:群体5对广告的接受程度最高,非常愿意点击广告。群体2更喜好高价格的商品,对购买高价商品抱有极大兴趣。

② 用RFM模型对用户进行划分

根据用户在购物深度、点击率、观看广告商品的平均价格3个维度的表现,将用户划分为5类客户。

(1)重要保持用户

这类用户有着高点击率,有更大的可能将用户的点击率转换为实际的购买行为。并且喜欢在平台上进行购物,是最理想的客户。

应优先将广告资源投放给他们身上,维持这类客户的点击率

(2)重要发展用户

这类用户点击率中等、也喜欢在平台上进行购物,并且对广告商品的价格适中。具有很大的发展潜力

应加强与这类用户的联系,培养其点击广告的习惯,使他们成为高点击率的用户

(3)重要挽留用户

这类用户点击率偏低,但是其浏览的广告商品的价格很高,对该类用户进行挽回,能提高广告转化为实际购买行为的价值

应加强与这类用户的互动,延长这类用户的生命周期

(4)一般用户

这类用户点击率低,浏览广告的商品价格适中。这类用户没有点击广告的习惯,偶尔点击广告的商品价格也不高

应尝试投放多种类型的广告给这类用户,观察是否能找到用户感兴趣的广告商品类型,进而提高点击率。

(5)低价值用户

这类用户点击率低,浏览广告商品价格低,属于平台的免费用户,用户价值较低

根据聚类结果,对应上述五类客户类型,进行匹配,得到客户群体的价值排名:

根据结果,我们可以发现5类用户的分布如图所示:

可以看出:最有价值的3类用户占比约为20%。这20%的用户必然贡献了广告点击率的绝大部分,平台如果希望广告效果好,就需要投入资源服务好这部分用户

一般用户、低价值用户仍为平台用户的主体,对于这类用户需要通过运营/营销策略,提高他们的活跃度/点击率,争取将他们转换成重要的用户。

③  小结

重要用户占比20%,对于群体1、2、5里的用户,应针对用户特点,定向推送广告,在高点击率的同时,争取进一步提高广告的转化率,将点击落实为购买。

其他用户占比80%,对于群体3、4的用户,应推送多种类型的广告给这类用户,寻找用户对哪类广告的商品更感兴趣,并可以通过相应促销活动,提高其活跃度和广告点击率,争取将这类用户转换为重要用户

P4 结论和建议

把上述的分析过程中的小结正例出来,得到分析结论,并综合所有的结论提出建议:

分析报告到此撒花结束~

点击这里→了解更多精彩内容

揭秘淘宝平台广告策略,拆解最佳投放实践相关推荐

  1. 淘宝展示广告中的优化点击成本算法

    Optimized Cost per Click in Taobao Display Advertising Han Zhu, Junqi Jin, Chang Tan, Fei Pan, Yifan ...

  2. 企业IT架构转型之道:阿里巴巴中台战略思想与架构实战. 3.1 淘宝平台“服务化”历程...

    3.1 淘宝平台"服务化"历程 2007年,淘宝已经拥有超过500人的技术团队规模,整个淘宝网站是一个几百兆字节的WAR包,大小功能模块超过200个,在当时淘宝业务计划处于每隔几个 ...

  3. 揭秘淘宝上那些删差评不为人知的套路!

    最近松松编辑杰哥从网友爆料了解到,现在网店消除差评又出现新玩法了,网店主针对差评用户删除差评研究出了新套路,一旦中招就会被套路惨了! 揭秘淘宝上那些删差评不为人知的套路! 那么网上的那些花三百块钱处理 ...

  4. 视频教程-程序员必备算法课!(揭秘淘宝购物车算法)-机器学习

    程序员必备算法课!(揭秘淘宝购物车算法) CSDN讲师名下集合了诸多业界知名讲师的公开课内容,内容涵盖人工智能.大数据.区块链等诸多热门技术领域的最佳技术实践,聚合美团.滴滴.AWS.科大讯飞等知名企 ...

  5. 太硬核了!这个项目几行代码就把淘宝、拼多多拆解透了

    都2020年了 还没用过微服务吗? 面试的时候高并发回答的总是不能让面试官满意? 一个互联网项目究竟有多少细节? 网上搜了一堆秒杀系统方案,究竟真实的线上电商该怎么做? 那么你缺乏这两个字 实 战 消 ...

  6. [Hadoop in China 2011] HBase在淘宝平台上的应用和改进经验

    http://tech.it168.com/a2011/1202/1283/000001283152.shtml 在今天下午进行的NoSQL系统及应用分论坛中,来自淘宝的软件工程师张毅发表主题演讲&q ...

  7. 揭秘淘宝286亿海量图片存储与处理架构,互联网营销

    [IT168 专稿]8月27日下午,在IT168系统架构师大会存储与系统架构分论坛上,淘宝网技术委员会主席,淘宝网核心工程师章文嵩向我们详细介绍了淘宝网图片处理与存储系统的架构.章文嵩博士的演讲日程包 ...

  8. 弘辽科技:淘宝平台的推广方法有哪些?六大推广方式介绍

    随着淘宝商城的不断壮大,越来越多的商家开始在淘宝开网店了,市场的竞争逐渐增大,作为淘宝商家有必要去学习一下淘宝平台的推广方法哦,接下来为大家介绍几种常见的推广方式. 1.淘宝客,是一种按成交计费的推广 ...

  9. jQuery仿淘宝精品服饰广告的实现

    技术栈涉及 隐式迭代的遍历  筛选选择器 和为元素排序等 代码如下: <!DOCTYPE html> <html><head><meta charset=&q ...

  10. 弘辽科技:淘宝平台如何处理商家sku作弊问题?有哪些处罚?

    原标题<弘辽科技:淘宝平台如何处理商家sku作弊问题?有哪些处罚?> 随着互联网经济的蓬勃发展,越来越多的人涌入电商行业,入驻淘宝平台.这让淘宝平台的竞争压力异常的激烈,所以有些商家为了让 ...

最新文章

  1. mac Hbuilder 无法打开的解决方案
  2. android get请求最长字符串,android – Retrofit @GET – 如何显示请求字符串?
  3. oracle登陆无效参数是啥意思,关于参数无效的详细介绍
  4. [MongoDB] MongoDB的基本操作以及文档的增删改查
  5. Python字典中 get() 函数的使用
  6. 运行MonkeyRunner时使用Genymotion模拟器
  7. java ant教程_ant教程(三) ant入门
  8. karto探秘之open_karto 第二章 --- 参数解析
  9. mysql必知必会样例表_《SQL必知必会》笔记1-样例表说明及建表语句
  10. 数据采集与清洗基础习题(四)Pandas初体验,头歌参考答案
  11. 华为交换机配置console口和telnet密码实例
  12. matlab的火山图,ggplot绘制火山图
  13. 创建 Windows XP 图标
  14. 微积分导论--Continuity
  15. 中国大陆开源(Linux)镜像站汇总
  16. 通过银行卡号获取所属银行
  17. Mysql关联查询的几种方式(详解)
  18. 一个 IT 人的自传,我在语雀开源人生
  19. 安装linux系统的ppt课件,Linux系统安装与入门PPT演示课件
  20. lisp画弯箭头_AutoCAD中怎么画箭头 CAD画箭头的方法

热门文章

  1. android wifi音箱,(原创)图文并茂教程,手把手教你用安卓手机当电脑的无线扬声器(喇叭)...
  2. raw格式转换成qcow2格式
  3. win10 外接显示器后出现input signal out of range
  4. 制作海报,你一定会用到的这些工具网站
  5. 《遥远的救世主》遵守客观规律(五)——文化属性
  6. matlab里的pid参数调节,基于MATLAB的PID控制系统参数调节
  7. 生活是艰难的,我又划着我的断桨出发了
  8. Apache Commons Daemon简介翻译
  9. PHP pdf转化为图片(PNG)
  10. Linux内核 触摸板,【教程】给Linux(elementary os)配置更多的触摸板手势