《大数据实践之路》这本书,是由多位数据产品和分析师,根据自己的工作经验和个人总结,汇总而来。

类似这种合著作品的例子,现在越来越普遍,优点是可以发挥所长、精心雕刻,缺点也较为明显,就是章节之间割裂感比较严重,叙述风格和笔法习惯也各有千秋。
所以本书为了统一内容,设定了一群数据工作者在某电商企业工作的故事背景,以此为依托,展开叙述。

不可谓不用心。

但是对故事的把握程度,不敢妄言。
回到书本内容本身,在副标题中已经表明内容主要分为三块:

1、数据中台
数据中台的主要构成有:元数据中心、数据指标中心、数仓模型中心、数据资产中心以及数据服务中心。
对穿插内容进行详细的解剖和枚举示例,是这一部分的重点,也让数据中台部分成为全书的支撑点和核心点。

2、数据分析
对数据分析理论进行了比较简略的介绍。
其亮点在于,在把数据分析按照场景划分为预测性、描述性和诊断性分析之后,对每个场景的分析步骤进行了详细的拆解。美中不足的是,尚缺乏策略性分析的场景描述,以及对各个场景的层次感把握力略显乏力。
当然,这些都算是作为读者的我的个人见解。

3、数据产品
数据产品的主要构成有:BI系统、用户画像体系、电商反作弊体系、资讯个性化推荐和电商个性化推送。

个人理解,对于BI和用户画像体系的搭建,是考察一个数据分析师基本产品能力的风向标。
通过书本的篇幅可以看出作者和我的意见不谋而合,对画像搭建感兴趣的同学可以详细参考用户画像体系部分。

总的来说,这本“小册子”大体框架令人满意,但是对于详略程度的拿捏做得不是很好。
可读性:优;实用性:良。


最后,引用和总结书中一些颇为出彩的陈述:

1、数据质量的衡量涉及数据的完整性、准确性、一致性、规范性和时效性。
完整性基于业务和数据采集完整度,准确定规定了数值与真实值之间的误差,一致性要求多方数据出口保持一致,规范性要求统一的数据格式以便采集分析,时效性要求能在恰当时间范围内出数。

2、针对不同类型的元数据,可以把它们组织起来分为3组:数据属性、数据字典、数据血缘。
这些数据有几种类型:基础信息、标签信息、业务信息、技术信息、权限信息。

3、指标分为原子指标与派生指标:

  • 原子指标:事实逻辑表中某个字段的统计值(sum、count、max、min、avg),如下单用户数、下单金额等。
  • 派生指标:基于原子指标,进行维度组合后产生的指标,如近1天商城下单用户数、本周商城黄金会员下单金额等。

原子指标无业务意义,它只是预定义的代码片段。我们在业务中用到的指标基本都是派生指标。

4、数仓模型中心设计思路:控制数据源、划分主题域、构建一致性维度、构建总线矩阵、数仓分层建设、数仓效果评估。
数仓一般分为3层:ODS层(操作数据存储层)、CDM层(公共维度模型层)和ADS层(应用数据层)。
数仓效果评估,采用量化的指标:规范度、完善度、复用度。

5、数据赋能业务一般会经历4个环节:数据表现、业务原因、业务策略和作用方式。

  • 首先,我们通过数据去评估业务状态,发现业务表现异常;
  • 其次,我们全面地分析数据,并结合一线的调研反馈,反复地进行猜想和数据验证,弄清楚数据表现背后的业务原因,思考解决问题的业务策略;
  • 最后,我们落地执行业务策略,监控落地效果并不断地迭代业务策略,直到问题被解决,业务发展进入正轨。

6、业务策略存在两个闭环:逻辑闭环和业务闭环。

  • 逻辑闭环:数据分析的过程,在逻辑上要实现闭环,论据要能够支撑结论。
  • 业务闭环:业务策略在业务上的落地执行要实现闭环,不断地被调整和迭代。

7、数据分析五板斧:细分,对比,关联,因果,趋势。

8、在取数之前多思考为什么要取这个数据,分析的框架是什么,分析的目的和接下来要取的数据是否能印证对应上等。
不要把自己的工作内容和思想局限在取数这件事上。

9、数据分析,按照从浅到深分为四个阶段:描述性分析、诊断性分析、预测性分析、策略性分析(原文无策略性分析)。

  • 描述性分析:回答数据是什么;
  • 诊断性分析:回答数据为什么;
  • 预测性分析:回答数据将是什么;
  • 策略性分析:自动化制定策略。

10、企业从两方面考核数据分析师的产出:

  • 专业产出:拆解的项目年度/月度目标、搭建的业务评估指标体系和分析的业务策略等都属于数据分析师的专业产出;
  • 业务结果:往往数据分析师的绩效与业务结果不会被强行绑定,但业务结果差的数据分析师一般不会获得好的绩效。

11、要想有好的工作节奏,我们就需要想清楚当下自己的核心诉求是什么,要学会不断地根据客观环境调整自己的状态,让自己的工作与核心诉求保持一致,最大地激发自己的热情与创造力,要经常反观自己是否还位于第一象限。

12、诊断性分析的一般流程:发现问题—定义问题—拆解问题—寻找原因—提出解决方案—落地执行—反馈迭代,直到业务问题被解决。评估标准一般是关键指标的变化符合预期。

13、在可视化实践中,初学者需要注重积累和总结,逐渐形成适合自己的图表配对模板和配色风格。

14、精准营销的4R法则,即通过合适的渠道(Right Channel),在合适的时间(Right Time),将合适的产品(Right Product)推送给合适的用户(Right Customer)。

15、好的push应该具备4个要素:效率高、算法准、推荐好、展示靓。

小曾曾读书笔记 ||《大数据实践之路》相关推荐

  1. 小曾曾读书笔记 ||《私域流量运营指南:从流量到高利润》

    <私域流量运营指南:从流量到高利润>,作者陈韵棋和老胡.这本书讲解了什么是私域流量.私域流量圈层.私域流量引流和私域流量运营. 什么是私域流量? 即在独立自主的空间(线上或线下)内,流量主 ...

  2. 企业品牌私域化运营,私域流量只是起步

    文 | 公关之家 作者:Leon 私域是既增长之后备受关注的品牌概念性关键词,同时也是品牌全生命周期中各部门协同工作的重要目标. 企业品牌私域化运营,私域流量只是起步 品牌公关在企业公共关系对社会.媒 ...

  3. 2021-10-13企业品牌私域化运营,私域流量只是起步

    企业品牌私域化运营,私域流量只是起步 私域是既增长之后备受关注的品牌概念性关键词,同时也是品牌全生命周期中各部门协同工作的重要目标.品牌公关在企业公共关系对社会.媒体.公众的关系处理过程中,不仅需要充 ...

  4. 妙用公众号好评返现,赋能电商提升DSR评分和私域化运营构建

    目录 前言 如何提升评价参与率和构建私域流量? 如何安全的提升好评率? 如何通过公众号/企微实现好评返现? 前言 评价对电商运营至关重要,买家的每一个评价直接影响店铺的DSR动态评分,关系到店铺的搜索 ...

  5. 推荐系统赋能证券行业智能运营,达观数据联合易观方舟发布《证券行业私域客户运营白皮书》

    2021年9月2日,北京确定将设立证券交易所,聚焦服务创新型中小企业. 至此,我国将拥有上交所.深交所.港交所.北交所四所证券交易所,多层次的市场资本结构逐渐完善,证券行业也将迈入高质量发展的新阶段. ...

  6. 【报告分享】DTC品牌私域用户运营手册-易观方舟(附下载)

    摘要:DTC模式带来了一场消费界的革命,其试图去除经销商.零售商等中间商环节,将价格更加低廉.品质更有保证.以及更富有个性的商品直接售卖给消费者,与消费者直接建立对话关系的模式,完全颠覆了传统品牌与消 ...

  7. 双11福利!买课即赠书——11个品牌的“增长炼金术”+《私域不完全指南》

    出品:增长黑盒研究组 噪声与判断黑洞 2019年,消费行业万众齐呼,"我国消费迎来黄金时代","每个新消费品都值得重做一遍". 2021年,媒体跟VC圈又频频传 ...

  8. 实操:怎么从数据切入私域长效运营?可以这样做

    虽然过去无数次强调"无数据,不运营",但在私域运营面前,我们对数据及数据系统的依赖变得更重.更基础. 数据对运营效果的另一个影响在于用户价值本身:通常我们会强调用户生命周期,这是精 ...

  9. 巨准私域案例拆解丨“认养一头牛“如何通过私域分层运营提升复购

           在乳制品行业中,如果要说新晋的黑马的话,就不得不提认养一头牛.这个创建于2016年的品牌,目前的全网用户已超过2000万,其中含有500多万的资深会员.创立至今,其销售收入突破了15亿, ...

最新文章

  1. Android Handler杂记(结合别人的blog)
  2. rtmp协议封装h264与h265打包flv发送
  3. Vagrant的用法
  4. HTML解析利器HtmlAgilityPack
  5. TypeScript void 和 undefined 的区别
  6. 【jenkins】jenkins CI/CD搭建基本过程
  7. 国内最火5款Java微服务开源项目
  8. 【NLP】毕设学习笔记(二)transformer
  9. 【UML】部署图Deployment diagram(实现图)(转)
  10. OpenShift 4 之Kafka(1)-部署Strimzi Operator运行Kafka应用
  11. 计算机电气化,计算机在电气化系统的应用
  12. 产品经理为什么越来越不值钱?不懂数据,只能尴尬退场
  13. 2.移植3.4内核-支持烧写yaffs2,裁剪内核并制作补丁
  14. idea 导入项目时 “Import project from external model” 和 “Create project from existing sources”的区别
  15. gsp计算机系统系统操作培训,gsp计算机系统操作PPT.ppt
  16. 【好玩的应用】QQ连连看辅助工具
  17. 玩转百度语音识别,就是这么简单
  18. 苹果测试充电速度软件,ChargerLAB推出iPhone 8快充测试工具POWER-Z
  19. 在Idea解决找不到sun.misc.BASE64Encoder及sun.misc.BASE64Decoder找不到包
  20. 不用装Windows!在MacOS中也可以玩英雄联盟LOL国服!

热门文章

  1. centos系统关闭ntp服务器,CentOS 7配置NTP客户端
  2. [原]jQuery .tmpl(), .template()学习
  3. 计算机学业水平测试word几,高中学业水平测试(会考)信息技术科目word操作题.pdf...
  4. 服务器怎么设置显示超频,显示器显示超频怎么解决
  5. 科技爱好者周刊(第 188 期):音乐是反社交
  6. 利用Tableau进行下钻分析
  7. 课设——论文中的为什么要引用参考文献以及如何引用
  8. Python大牛之路所需技术和工具
  9. Windows 系统内存占用过高
  10. 锐捷网络:引领地铁移动互联网快捷交付2.0时代到来