一、数据分析多元思维模型

背景

瓶颈、职业发展不顺利、掌握好哪些能力

中观能力

真正的专业度,能够很好的发现其他分析师中的问题;需要长期总结和思考,但多数同学没掌握

  • 中观能力:专业度、包括技术理解、逻辑性、价值点三个点。反应分析师基本功,套路熟练、思考到位与否一种标准

    • 技术理解:对分析师需要的技术是否理解到位,是停留在理论阶段还是实践阶段
    • 逻辑性:整体思考的逻辑性是否欠缺
    • 价值点:做出来的东西价值在哪,如果你是决策者,你敢不敢立马规划落地。
  • 技术理解:

    • 数据处理中,有一个是数据标准化,常见的都是max-min方法、z-score方法,指数对数法,一定要理解这个只是理论上的方法,只有理解到数据标准化的本质目的是去除量纲量级的差异性。
    • 真实案例:对to B公司来说,往往都是除去头部几个很大的客户,剩下的都是中小客户,以max-min方法为例,如果直接用这种方法,会造成除了头部几个数据有数值外,其他基本为0,数据非常稀疏,可用性和理解性很困难。
    • 两个解法:① 对客户进行先分群,再max-min方法进行标准化;② 以90%中位数替代max,消除头部影响。
  • 逻辑性:

    • 真实案例:数据分析师研究最近一个月的数据,发现所有与留存相关的因素中,留存和自媒体文章下发的占比存在高度相关,于是建议多下发自媒体文章,结果执行开始几天微涨,后续大跌。
    • 解释:相关性是一种基于向量的伴随关系,不代表直接的因果关系(但确实是因果关系的一种可能性),具体到这个例子,留存的影响因素本身就非常多,不可能是因为某一中两个指标就能很好提升留存的,后来复盘发现,最近刚好有一些重大热点导致留存提升,而这些重大热点文章是以自媒体文章为主,最终造成文章下发占比能提升留存的假象。
  • 价值点

    • 数据分析中,有些就是描述性统计,这没办法,能做的就是快速解决这种,不要耽误时间
    • 对于指导性、预测性分析、价值最大,最花时间,但一定要注意到价值点,即使只有1个
    • 有没有价值不是分析师说了算,是业务方说了算,有些点很好但暂时无法落地,就不要管他。

微观能力

有效沟通力+快速发散收敛力,能够从业务的交流中发现问题

  • 背景:中观能力相同的情况下,有些分析师总是表现得比其他分析师更加优秀,比如:

    • 很多想法,找到切入点——想象力
    • 最短时间给业务方一个较好的答复——解决问题能力
    • 更好的数据敏感度,能够第一个发现数据问题并给出解法——敏感度
    • 会议上,总是能提出自己的独到观点,让别人觉得他很聪明——快速发现提问
    • 总是能很好的知道业务在干啥,而他的视角又一直高于业务,所有人认可——高维视角
    • 始于经验,终于沉淀,注重点点滴滴,思维高度活跃,总是能找到一些线索
  • 微观能力理解
    • 微观能力:包括有效沟通能力和快速发散收敛能力
    • 前提:先知道业务怎么想的,怎么做的,然后从中发现问题或者切入点,解决问题,这样就能高于业务
    • 有效沟通能力:与业务狠心人员沟通,从谈话中捕捉到很多有用的信息。两个技巧:
      • 黄金思维圈法则:在了解业务的情况下,反问业务方为何要做这件事,基本上,业务方都会有一个很具体的回答,往往都能在这里找到切入点。
      • 做一些准备工作再沟通:再业务沟通中,如果没有提前准备一些业务知识和数据,整个过程中就是业务在主导,你还怎么发现问题呢?
    • 快速发散收敛能力:基于沟通中的有效信息,快速提炼总结找到最好的分析切入点。
      • 举例:在制定公司级KPI的时候,业务分析师需要预估下一年年中的MAU和DAU,该问题有很多种解法:时间序列、行业环境、渠道分析都可以作为切入点
      • 最终觉得渠道分析切入点会更加合理:
        MAU=MAU新用户+MAU老用户
        MAU新用户:明年渠道侧每个月能够带来的新增量多少(这个与明年预算高度相关)
        MAU老用户=MAU上月新次月老(基于渠道)+MAU上月老次月老(历史数据)+MAU回流(历史数据)
  • 微观能力培养
    • 尽可能多和业务核心人员,特别是业务leader沟通,看他们如何思考业务
    • 多看心理学、社交学、记忆力、科普类、经济学的书籍
    • 刻意练习、慢慢养成习惯

宏观能力

洞见的全局观,能够从社会事件、整个行业发展中找到业务的决策方向(极难,平台和天赋缺一不可)

二、电商数据分析—以京东APP为例

1、如何去看京东APP

用户视角

  • 搜素:流量最大的一个入口
  • 广告banner:各种活动宣传
  • 导航:十宫格、相对比骄稳定
  • Feeds流:电商+内容
  • 个性化推荐:千人千面

分析师视角

作为一名数据分析师,应该要能更深入,并且有层次的去看这个APP数据,有三个问题需要大家思考:

  • 1、引流(场):首页作为最大的带量位,分发效率怎么评估
  • 2、漏斗(货):北极星指标交易额只是一个数字,更加重要的是理解这个数字转化的过程
  • 3、用户(人):作为一款非常成熟的APP,老用户相对比较稳定,但新用户获取应该怎么优化。

2、首页的分发效率

分发效率评估

  • 除了要关注日活、留存、渗透率这些常规指标外,更加重要的是找到一些能够反映产品问题的指标
  • CTR:点击UV/曝光UV,反应用户点击欲望的指标,非常重要,只有点击才能产生交易,如果较小,首页问题较大。
  • 人均访问(点击)页面数:总访问页面数(pv)/总访问uv,只有多访问页面,才可能产生交易。
  • 而围绕这两个指标,按照维度拆解方法,可以发现更多问题,比如CTR突然低了,那么是所有坑位的ctr均低还是个别引起的

分发效率举例—人均访问页面数

  • 首页对搜素的分发能力最强
  • 618主要影响的是搜素这个坑位,因此在活动期间,要把资源和人力都往这块投入

分发效率总结

  • 基于日活、留存、渗透、分发效率,基本上能够对app的整体数据有个大概了解
  • 作为一名优秀的分析师,除了要把自己负责的产品做好外,更加重要的是不要设定边界,主动去了解整体数据,在这个过程中,你需要找到负责的产品跟大盘的数据关系:
    • 1)该产品确实很好的带来了大盘的提升
    • 2)该产品只是在抢大盘的流量
    • 3)该产品部分抢大盘的流量,部分提升,那么提升度到底多少
  • 找到:业务功能与产品核心指标的管联系,量化、量化、量化

3、绕不过的漏斗分析

背景

了解完整的整体数据后,肯定要看具体细分数据,虽然整体APP坑位很多,但一切都是围绕交易额这个目标,而电商交易额的本质是转化率,所以任何一个坑位都绕不开漏斗模型。
在所有的坑位中,搜索是最大的一个流量入口,因此以搜索为例:

了解每层漏斗的影响因素

1、请教老同事 2、买电商书籍回来查看 3、多机型体验产品

  • 搜索主界面全部UV:引流渠道:桌面图标打开进入搜索还是其他
  • 店面页UV:搜索框搜索、热点搜索、语音搜索
  • 详情页查看UV:客服、评论、店铺设计、商品属性
  • 加入购物车UV:尺寸、颜色、数量
  • 提交订单UV:物流、是否支持7天无理由退货、发票、运费
  • 收银台UV:支付方式多样性
  • 交易成功UV:密码错误、冲动消费、界面异常、其他打断

举个例子

问题:最后一步转化率太低,经排查用户还没到输入支付密码那一步,所以支付侧的问题不会很大,所以要去研究这部分用户在收银台界面还做了什么

  • 发现有很多用户去点击右上角的订单中心,并且回到订单中心时,通过热力图模型发现很多用户在点击地址这个位置
  • 猜测:很多用户因为地址错误又无法修改直接放弃支付
  • 整个分析逻辑虽然简单,实际中非常考研分析师

总结

应该说电商的大部分数据分析都会跟漏斗有关,除了经验之外,更加重要的是对产品本身的多体验,以及对竞品的学习,保持好奇心和敬畏心,也只有这样,才能慢慢关注到其他同学关注不到的点,而这些是培养良好微观体感的重要一步

4、新用户分析

背景

作为一款非常成熟,在一线城市很多忠实用户的app,当前在用户体量上与手淘相差仍然较大,因此我们会看到京东与各方app战略性合作,共同拉新。
拉新必然就要衡量拉新效果和拉新优化,拉新效果内部数据不太清楚,但是作为一名分析师,可以去看整个app在拉新上可以优化的点。实际上拉新如果做的好,比老用户分析更容易出成绩。

新用户产品体验

新用户优惠策略思考

  • 逻辑性:作为一个新用户,对任何APP都不熟悉,第一感觉就是先浏览。 给用户发优惠券固然可以提高第一天消费的概率,但用户首先想到的是先浏览。 结果你引导用户注册,从用户的角度来看,这有点不合理,点击率也不会很高
  • 优惠券分发:首页上曝光了6元京东支付券和35元全类券,而188元礼盒中实际有8元运费券、40元电子娱乐券和20元超市券。 对于新用户来说,京东支付很陌生。 35元的全品类券使用费用是500元,要求有点高。 能否做两个优化:
    • 1)首页优惠券曝光,将京东6元支付券换成每个用户都知道和关心的8元运费券
    • 2)京东本身的主要用户群体是电子的, 因此,用40元的电子娱乐优惠券代替35元的全品类优惠券,一方面会给用户带来更大的折扣,另一方面也会带来一定的惊喜感。 当然,推荐优惠券时最好加上个性化(肯定有数据)
    • 文案:在第二张图片中,除了优惠券占据了中间的坑位外,上下两个位置都没有有效的内容。 增加更多的坑暴露,植入识别度高的词:“可用”换成立减(“可用”为描述性词,“立减”为动作词)。

新用户分析建议

新用户与老客户相比,由于对APP不熟悉,所以在漏斗环节上,可能有几个特点:

  • 1)用户行为比较离散化, 数据可能有几个主要的漏斗
  • 2)某一点的转化率远远低于老用户
  • 3)新用户当天以逛为主,不下订单,一段时间后再下订单。
  • 数据分析师能做的是: 把自己想象成一个新用户去体验各种各样的路径,以及异常的漏斗进行维度拆解(例如,是不是某个渠道的新用户转化率低导致整体低)

三、互联网金融行业to C授信模型—以芝麻信用为例

1、背景介绍

互联网金融行业数据分析师的角色

互联网金融的本质是风控,数据分析师在这个行业基本上有两种角色:

  • 风控分析师:除了一定的模型理解能力,还需大量的行业和法律法规经验
  • 数据建模师:要求对算法的理解较深,相对来说对行业经验要求不是很高
  • 基本上数据挖掘分析师,数据建模师和产品经理都会去兼职这块
  • 而在产品对象上分为toB和toC:
    • toB:定量打分卡+定性行业经验
    • toC:个人行用分
    • 而无论toB和toC,在决策上当前最依赖的是央行征信报告。

数据建模师到底干什么活

2、授信模型

芝麻信用分结构

  • 身份:小学毕业还是博士毕业——稳定新
  • 履约能力:有没有房车——兜底性
  • 信用历史:信用卡有无预期——历史性
  • 人脉关系:你的支付宝朋友是不是土豪——稳定性验证+弱价值性
  • 行为偏好:喜欢买奢侈品还是地摊货——真正价值

数据源

数据变量为何那么多

数据变量分为原始变量和衍生变量

  • 原始变量:直接存储在数据库里的最基础变量,比如你的每天的交易额
  • 衍生变量:因为金融的本质是风险,所以都要对原始变量进行加工转化,一般是三种
    • 时间维度衍生:最近1个月交易额,最近3个月交易额
    • 函数衍生:最大交易额、最小交易额、交易额方差
    • 比率衍生:最近1个月交易额/最近3个月交易额
  • 选择变量的时候:基于RFM原则,即最近、频次、钱,所有跟这三个属性相关的变量都要先保留

数据处理

实际上所有的数据处理,数据建模都是为业务服务,真实工作中,数据处理和数据建模都是慢慢迭代优化的,所以数据处理在前期不会搞的很负责,一般就3种:

  • 数值型和字符串型字段缺失性和合理性检验,剔除无效字段(50%以上即可去掉)
  • 数值型字段的相关性验证:前期基本上所有的字段都会拿出来,肯定有非常多的变量相关性非常强,而这个对于模型训练是没有帮助的,因此会把相关性强的先过滤掉
    • 一般0.7以上就是高度相关,型惯性非常简单,同时也非常实用
  • 字符串字段的离散化处理:一般按照常识理解,直接分段取值,在模型前期,只要大的逻辑没有问题即可

数据标准化

所有的变量都已经数值化了,但是在量级和量纲上相差很大,如交易额和交易次数,这就没有可比性,所以要对所有的字段进行标准化,标准化的方法很多,选择合适的都行,这块对后面的模型效果没有影响。无论是max-min还是z-score
数据标准化之后(假设就是max-min),所有的变量取值区间都在【0,1】范围内了,这个时候就可以数据建模了

数据建模前思考

  • 由于身份特质、履约能力、信用历史、人脉关系、行为偏好5大模块,在不同时期权重不一样,所以每个模块都要单独建模。
  • 在建模之前,一定要把业务目标先理一理,这样才能找到用什么模型,就芝麻信用来说,我们的目的是希望根据用户在这5个模块的综合芝麻分开给用户一些其他额外服务,比如花呗借呗免押金,同时保证用户不违约
  • 因此逻辑上就是:根据用户的数据,算出用户违约的概率,而这个概率也可以和转化为用户的分数,所以逻辑回归模型就自然而然用上了

具体方案的反推:以终为始

  • 综合芝麻分—>综合概率—>5个模块各自的概率加权—>每个模块的逻辑回归模型—>每个模块的训练集和测试集
  • 以历史信用为例,假设该模块包含的字段有最近一个月主动查询金融机构信用次数x1,最近一个月需还贷款总额x2,最近一个月逾期总额x3,那么其违约概率就为:

具体例子

A用户:身份特质、履约能力、信用历史、人脉关系、行为偏好分别算出的概率为0.1, 0.2 , 0.3 , 0.4 ,0.5
根据当前产品所处的阶段,觉得信用历史和履约能力,那么这两个模块的影响权重就是0.35,其他都是0.1
那么小A违约的概率就是:
P=0.1×0.1+0.35×0.2+0.35×0.3+0.1×0.4+0.1×0.5=0.275
分数公式:score=(1-P)×A+B,区间为[300,900],可以算出A=600,B=300
所以A的芝麻综合分=0.725×600+300=735

模型离线效果指标

  • 混淆矩阵:查准率和查全率
  • ROC曲线:根据混淆矩阵做出的,区分模型是否能较好把好坏样本分开的一个图,一般嗾使取ROC下面的面积AUC,来衡量模型效果,越大越好,一般至少0.6以上
  • 离线模型看着两个参数就够了,这块本身有点难理解,特别是ROC曲线不太好举例,真实工作中最重要的还是坏账率这个评估指标

模型运行周期

产品初期,因为模型的变量太多,所以模型迭代的速度非常快,几乎每个月跑一次分数,这一时候可能有用户分数奇高,这些都是正常的,而这些需要不断调整重量和系数,逐步优化, 但最重要的还是落地效果,就是使用模型后的坏账率如何,这就是模型的落地了

3、模型落地

落地前

有了这样一套模型后,你要出去找落地场景,我们看到芝麻信用围绕吃喝玩乐进行各种产品服务,举例:
如何根据芝麻信用分就可以申请招联金融信用额度,那么这就涉及到两个公司的产品合作了。金融行业的合作都是非常小心的,所以在正式合作前:

  • 招联金融会提供一批样本给芝麻这边,芝麻这边数据建模师根据模型给出这批用户的违约概率
  • 招联金融根据芝麻给出的用户违约概率,算模型的准确度
  • 如果模型准确度还可以,双方才会正式展开合作(用户群覆盖度和模型准确度)

落地中

正式落地时,招联在给每个用户评估信用时,实际上芝麻信用分只是一个参考维度而已。一般都是这样:

  • 1、机器调用该用户的央行征信报告评估值X,这个是最重要的
  • 2、接口调用用户的芝麻信用分Y
  • 3、该用户在招联的信用评估情况Z
  • 基于XYZ,内部再根据专家规则法出一套授信方案(很灵活),到这一步,基本上模型就正式使用了

落地后

前期一般都是每一周,招联金融都会和芝麻这边对一次坏账情况,只有到这个时候,模型的参数调整才是最有意义的,这个时候也是很考验数据分析师的时候,调参方法:

  • 1、先找出是因为某个子模型引起的还是所有模型引起的
  • 2、如果是子模型引起的,直接调整该模型的参数即可,如果是整体模型都有问题,那就要重新进行数据处理了,如WOC分组,更换衍生变量,字符型字段重新打分等等

在前期,数据建模师是最忙的一个人,一旦模型稳定后,数据建模师更多的时候就是兼职数据挖掘师。

4、总结

  • 授信模型:数据源、数据处理、数据标准化、数据建模、模型落地,模型优化,这一套跟数据分析标准化流程非常像,模型最终的评估指标就是坏账率
  • 数据建模师:数据源在前期就已经决定了模型的效果,要具备良好的沟通能力和反馈能力,金融行业本身比较成熟,比模型更加重要的是分析师自身的想法和验证。在前期重点围绕数据源和数据处理,模型无论是逻辑回归决策树GBDT随机森林神经网络问题都不会很大,与纯互联网行业相比,金融行业数据建模师的价值更容易体现,而且相对更有趣

四、游戏付费数据分析—以欢乐斗地主为例

背景

  • 电商——非常互联网
  • 互联网金融——直接就是跟钱打交道
  • 游戏——互联网思维+钱都要具备
  • 游戏行业用户两极分化比较严重:要么快速流失,要么就是玩的时间很长
  • 所以重点围绕俩个目标:
    • 1、尽量让用户晚点流失——流失分析
    • 2、让花时间的用户多变现——商业分析

指标口径

重要指标业务理解——常规指标

  • 1、DAU WAU MAU

    • 一个产品的日活、周活、月活
    • 以欢乐斗地主为例,日活就是每天打开该app的用户数
  • 2、留存率
    • 一般看次留、7留、30留存率
    • 次留率:第一天打开欢乐斗地主并且第二天也打开欢乐斗地主的人数/第一天打开欢乐斗地主的人数
  • 3、渗透率
    • 某功能模块的使用人数/该产品的日活
    • 欢乐斗地主商城渗透率=进入商城的用户数/DAU
  • 4、转化率
    • 针对某个连贯路径,使用下一个节点的用户数/使用上一个节点的用户数
    • 打开app–进入房间–参加比赛

重要指标业务理解——商业化指标

  • 1、ARPU

    • 一个时间段内的每用户平均收入
    • ARPU=付费金额/活跃人数(非付费人数)
    • 欢乐斗地主付费金额200万,活跃人数100万,每个用户平均收入2元
  • 2、CPM
    • 千次曝光的成本
    • CPM=(广告投入总额/所投广告的展示次数)×1000
    • 某广告主在欢乐斗地主的闪屏界面投入一个广告10万,共1000万次展示,CPM=10
  • 3、CPC
    • 每个点击用户的成本
    • CPC=(广告投入总额/所投广告带来的点击用户数)
      • 某广告主在欢乐斗地主里面投入一个闪屏广告100万,共产生点击50万,CPC=2
  • 4、ROI
    • 投资回报率
    • ROI=收入/支出=ARPU×用户数/所有支出
    • 双11在欢乐斗地主内部投放一个广告100万,最终带来收入200万,ROI=2

用户流失分析

流失定义

行业内用户流失的一般定义是: 一个月不使用该产品被定义为流失
事实上,不同的产品形式用户行为差别很大,像住宿类app低频高价值用户,欢乐斗地主7天不在线可能就已经流失了,所以要合理的定义的用户流失,流失的用户, 越快越好。
我们看看问题在哪里:
不能很好定义的流失是因为用户有可能回流,比如拍脑袋30天,结果为30天,大量用户回流

实际上流失周期确定=回流率稳定,一旦这个指标稳定, 就定义这个时间段天数为用户流失周期
回流率=回流的用户/流失用户数=某个周期内的流失用户数在周期结束后又回来了/某个周期内流失的用户数
所以,只要根据枚举方法,周期= 1、2… 30、再计算回流率,一旦回流率趋于收敛,该周期就是流失周期

欢乐斗地主用户流失分析

对于游戏行业的用户流失分析,即有其他行业的类似套路但又有一些差异化很大的点

  • 类似套路:看流失前最后一步在干撒
  • 差异化很大的点:最为一款非常复杂,需要花费用户大量实时间的app,分析师要想好好研究用户为何流失,也必须要去很深入的玩游戏,找到游戏的快感和痛点,跟其他玩家多交流,否则就是脱离业务。
类似套路:看流失前最后一步在干撒

差异化很大的点:深入玩游戏

经过多轮的游戏体验和玩家交流,返现一下问题比较严重:

  • 每天就送2次3000豆,基本上几分钟就输完了,没有找到快感,所以觉得没意思
  • 一旦豆子积累很多之后,输的会非常快,让人很气愤
  • 感觉作弊机制比较严重,有合伙坑人的可能性
  • 任务越来越多,越来越看不懂,可以直接换豆子的越来越少;头衔玩法好鸡肋
  • 商城内的豆子好贵,没有1元试用的吗

总结

游戏行业非常注重收入,分析师要每天看收入数据,所做的各种分析都要与收入挂钩
除了互联网行业那些分析方法,游戏行业更加注重分析师的深度体验,单纯的数据分析只能解决交互式的失误,而不能让游戏变得更好玩,所以分析师最大的价值是让用户玩得更爽,只有到这一步,才能实现真正的成长

付费分析

背景

游戏行业前期投入大,本身迭代快,所以对付费变现又非常高的要求。在付费分析上,整体思路:

  • 1、以付费金额分布和付费模块为切入点
  • 2、根据2确定未来重点是在高、中、低哪个群体
  • 进行AB测试,并每天看收入情况

付费分析


很奇怪为何没有5元的付费金额?
无论是信息还是坑位都出现较大问题,只能说产品功能没有体验到为

  • 1、当前用户付费金额以3、10元为主,也就是超过10元就很敏感
  • 2、贫农和富农是两个重要付费等级节点
  • 3、以欢乐豆充值为主,进一步看钻石坑位点击发现点击的人占比不高

用户群体针对性建议

  • 1、当前app的用户群体对钱很敏感,高端用户并不多,并且高端群体整体价值也不大——直接结论
  • 2、剩下80%未付费用户中,必然存在一部分群体欢乐豆少于3000无法游戏,同时也去了商城查看,但未消费(假设比例)——数据结论
  • 3、玩游戏都是有兴奋点的,兴奋点是多久,用户在什么级别最想充值?——体验结论
  • 因此结合1、2、3,是否可以:
    • 推出0.99元15000欢乐豆限名额抢卡片,同时在首界面就提示充值9.5折,进一步让用户觉得有便宜可占
    • 对于日活少豆用户,可以多送几次欢乐豆,让他体验时久一点,先兴奋起来
    • 当用户在贫农和富农等级左右时,加强付费引导,满足其成就感。

五、传统销售行业数据分析案例

原始需求

  • 以下,提供的具体表格
    1、门店信息表,包括维度:省份、城市、门店编码、大区、销售目标
    2、产品信息表,包括产品编号、产品名称、品类、单价、产品经理、销售目标
    3、销售经理表,包括销售经理,大区,销售目标
    4、销售数据表,包括年份、月份、门店编码、产品编号、销售金额、订单数、销售数量、单价、客单价、省份、城市、大区;
    具体如附件excel

  • 任务需求:
    一、2016全国销售状况报告(1-7月)
    1、目的:展示2016年全国的销售状况
    2、维度:细分维度包括但不限于时间、地域、产品等
    二、2016年全国销售状况报告框架(1-7月)
    1、展示形式:xmind导出框架图片
    2、目的:结构化展示报告的整体逻辑

需求解读

原始需求往往都是模糊的,但是:
分析师不要带着不好的态度去推拖业务方的需求,而应该跟业务方良好沟通,有些业务方就是表达能力不好,销售行业的核心就是销售额完成率:按照正常业务理解进行维度拆解

销售额完成率—区域完成率—门店完成率—销售经理完成率—产品、时段

总销售完成率

假设上年末定的7月份预期完成目标50%,那么当前实际上是完成目标的,这里需要总结:哪些点做的好,哪些点做的不好,从而超额完成目标

区域完成率

西南地区出乎意料的排在第二,华北地区不到50%,因此可以针对这两个地区挑选门店单独分析

各门店完成率

对于top10门店,必然有一些点做的好,所以要进一步挖掘,以门店58为例(西南地区)
对于最差的10家门店,也要分析差在哪里,提升空间大不大,如果不大,从减少支出角度算建议关闭门店,以门店3为例(华北地区)

门店58分析:

门店58分析:时段产品交叉分析

所有产品趋势基本一致:2月高峰,6月回暖,也就是行业有这种周期性
不同产品间销售额差异较大,用户偏爱产品4

门店58分析:产品单价和销售额相关性

落地项:该地区用户整体更加偏爱高价格产品,可进一步优化产品结构,产品偏高端
产品4和产品2表现最佳,产品经理可进一步该类产品特征

门店58分析:产品单价和客单价相关性

落地项:业务排查该类case,看用户为何有订单但未产生消费额,是哪个环节出问题,后续规避

门店3分析:

门店3分析:时段产品交叉分析

门店3的销售目标是20亿,是门店58的4倍,但是在同产品的实际销售额上均达不到4倍:
门店3完成率差,产品不是主要影响因素,很有可能是跟外部政策有关(北京市)

门店3分析:产品单价和销售额相关性

产品4和产品6相对表现最佳,进一步加大该类产品的资源

门店3分析:产品单价和客单价相关性

在订单上比较正常,而且客单价是单价的两倍,后期可以捆绑销售
更加可以说明门店58在部分订单上有问题

跟进项

  • 门店58地区用户整体比较偏爱高端价格产品,可优化产品结构,在产品特征上参考产品4和2
  • 门店58部分订单未产生消费额,需要进一步排查,在下半年规避此类情况
  • 门店3整体受外部影响较大,完成率低,可以进一步:
    • 查看地区竞品的销售额
    • ROI
    • 外部影响持续性评估
    • 结合1、2、3,考虑下半年是否关门门店3,减少支出

思考

门店3和门店58在用户偏好上差异较大,那么作为集团的boss,肯定更加关心的是区域性的用户产品偏好特征,而从进行针对性的产品投放优化
所以猜想:不同区域产品差异较大
接下来就是从数据上去验证

区域产品特征

提炼:如何去分析一个陌生行业

感到无从下手是因为:1、没有找到切入点;2、没有具体生动案例

数据分析-思维分析逻辑day02相关推荐

  1. 数据分析-思维分析逻辑day04

    一.问题定义和拆解 举个例子 很多人的困惑 小A同学每天都有大量的临时提数需求或者杂事,没有时间去做真正的专题分析. 感觉自己的能力提升不了,工作越来越没意思,做事不认真,老师出错,最近跟同事领导关系 ...

  2. 数据分析-思维分析逻辑day01

    文章目录 一.国企数据分析工作 招聘解析 常规工作 专题分析 软技能及面试技巧 二.BAT企业数据分析工作 数据异常排查 专题分析 1.特点: 2.例子 面试 1.准备 2.三个必问的问题 3.三个必 ...

  3. 数据分析-思维分析逻辑day05

    一.行业分析 行业分析的两种背景 当前公司准备进入某行业,需要分析师或者战略部门给出一份详细报告 业务发展遇到瓶颈,需要分析师去验证当前对产品的需求有无变化 行业分析-问题的识别和拆解 分析的目的:界 ...

  4. 【数据分析思维】逻辑树分析(费米估算)

    00 写在前面 为什么要写[数据分析思维]这个系列文章?还是回到一个最根本的问题上:数据分析师到底是干什么的? 我相信不仅是想入门的小伙伴,已经入行很久的数据分析师可能多多少少还是会有些不清楚.数据分 ...

  5. 数据分析思维分析方法和业务知识——分析方法(一)

    分析方法 5W2H分析方法 是什么? 5W what(是什么) when(何时) where(何地) why(为什么) who(是谁) 2H how(怎么做) how much(多少钱) 有什么用? ...

  6. 数据分析思维分析方法和业务知识——用数据分析解决问题

    用数据分析解决问题 明确问题 通过观察现象把问题定义清楚,这是数据分析的第一步 常见的错误 根据自己的经验主观地限定了思考的范围--确认偏误,寻找证据来支持自己已经相信的事情,从而抵制不同的看法:数据 ...

  7. 数据分析思维分析方法和业务知识——分析方法(二)

    分析方法 对比分析法 是什么? 对几个对象进行比较 衣服的价格 奶茶的大杯.中杯.小杯 有什么用? 追踪业务是否有问题 A/B测试 为同一个目标制定两个版本,只有某个方面不一样,其他均一样,然后看最后 ...

  8. 数据分析思维分析方法和业务知识——实战案例跨境电商行业

    整体 业务知识 业务模式 平台型 邀请卖家入驻跨境电商平台来进行运营 阿里巴巴.ebay 自营型 跨境电商平台自己运营 小红书 混合型 跨境电商平台兼有平台型和自营型 亚马逊 业务指标 广告漏斗模型 ...

  9. 【阅读笔记】数据分析思维:分析方法和业务知识

    数据分析思维分析方法 首页 5W2H分析方法 案例1:如何设计一款产品 案例2:设计一款App的调查问卷,如何设计问卷上的问题? 逻辑树分析方法 案例1:年度计划拆解 案例2:芝加哥有多少钢琴调音师? ...

最新文章

  1. 【分布式共识三】拜占庭将军问题----书面协议
  2. GoldenGate技术架构(二)
  3. Intel Realsense D435 pipeline对象指什么?
  4. php中bc,php中BC高精确度函数库
  5. 2 Hadoop的安装与配置
  6. java请求servlet,[Java]Servlet发送Post请求
  7. 通用的websocket模板代码
  8. 红橙Darren视频笔记 反射注解泛型简介
  9. 想让自己的网站变得精致吗?那就进来看看吧:跟随鼠标的天使
  10. oracle “**with as**”短语,也叫做子查询部分。
  11. 前端基础学习之CSS样式
  12. 如何在Linux下加载移动硬盘和光驱
  13. python3 输出内容格式化
  14. 【网络】趣谈网络协议总结
  15. 麻瓜编程python爬虫微专业_微专业:Python Web开发工程师(零基础课程),麻瓜编程侯爵主讲 价值2400元...
  16. 巨佬Jake Wharton曾说过:一个App只需要一个Activity
  17. 硬币找钱问题(最小硬币和问题)详解与代码实现
  18. win7如何设置wifi热点_Win7家庭版如何给文件夹设置密码?Win7文件夹加密方法
  19. 如何使用python画一个爱心
  20. kaldi运行cvte开源chain模型

热门文章

  1. office2016、office365和office其它版本JH
  2. vs2013编译ffmpeg之四十二 zvbi
  3. 使用Incapsula免费CDN加速godaddy空间
  4. 专为小白写的官方win10系统安装教程(U盘装机)
  5. 【产品经理】大学生知识库
  6. JavaScript Dom编程艺术(第二版)读书笔记 第三章DOM
  7. android华为登录云服务,华为云服务登录网页版
  8. Oracle Order by 按汉字拼音排序
  9. python-华三防火墙netconf编写移动策略
  10. 天龙八部科举答题问题和答案(全6/8)