在数据分析中,无论数据收集的过程多么科学,处理多精细、分析方法多么高深,如果不能将它们有效地组织和展现出来、对业务赋能,那么数据分析的价值就无法体现。今天看到了这篇来自趣店技术团队分享的文章,分享给大家一起学习,建议读完全文。

一、结构规范及写作

报告常用结构:

1. 架构清晰、主次分明

数据分析报告要有一个清晰的架构,层次分明能降低阅读成本,有助于信息的传达。虽然不同类型的分析报告有其适用的呈现方式,但总的来说作为议论文的一种,大部分的分析报告还是适用总-分-(总) 的结构。

推荐学习金字塔原理,中心思想明确,结论先行,以上统下,归类分组,逻辑递进。行文结构先重要后次要,先全局后细节,先结论后原因,先结果后过程。对于不太重要的内容点到即止,舍弃细枝末节与主题不相关的东西。

2. 核心结论先行、有逻辑有依据

结论求精不求多。大部分情况下,数据分析是为了发现问题,一份分析报告如果能有一个最重要的结论就已经达到目的。精简的结论能降低阅读者的阅读门槛,相反太繁琐、有问题的结论100个=0。报告要围绕分析的背景和目的以及要解决的问题,给出明确的答案和清晰的结论;相反,结论或主题太多会让人不知所云,不知道要表达什么。

上面讲了报告的写作原则,举个例子,参考艾瑞网,《留存与未来-疫情背后的互联网发展趋势报告》:

二、数据使用及图表

数据分析往往是80%的数据处理,20%的分析。大部分时候,收集和处理数据确实会占据很多时间,最后才在正确数据的基础上做分析,既然一切都是为了找到正确的结论,那么保证数据准确就显得格外重要,否则一切努力都是误导别人。

1. 分析需要基于可靠的数据源

用于鉴别信息/数据的可靠性,主要有四种方法:同类对比、狭义/广义比对、相关对比和演绎归谬。

同类对比:与口径相同或相近,但来源不同的信息进行对比。

示例:最常见的就是把跑出来的数据和报表数据核对校验。

狭义/广义对比:通过与更广义(被包含)或更狭义(包含)的信息进行对比。

示例:3C品类销售额与商城总销售额比较,3C的销售额更高显然是错误的,因为商城总销售额包含3C销售额;某些页面/频道的UV与APP总UV比较也类似。

相关对比:通过与具有相关性、关联性的信息进行对比。

示例:某平台的Dn留存率,对于同一个基准日期来说,D60留存率一定低于D30留存率的,如果出现大于的情况,那就是错误数据了。

演绎归谬:通过对现有证据的深入演绎,推导出结果,判断结果是否合理。

示例:比如某平台的销售客单价2000左右,总销售额1亿左右;计算得出当日交易用户数10万,通过乘以客单价,得到当天销售额2亿,显然与业务体量不符,为错误的数据。

2. 尽量图表化,提高可读性

用图表代替大量堆砌的数字,有助于阅读者更形象直观地看清楚问题和结论,当然,图表也不要太多,过多的图表一样会让人无所适从。

让图表五脏俱全,一张图必须包含完整的元素,才能让阅读者一目了然。标题、图例、单位、脚注、资料来源这些图表元素就好比图表的五脏六腑。

要注意的条条框框。

  • 首先,避免生出无意义的图表。决定做不做图的唯一标准就是能否帮助你有效地表达信息。
  • 第二,不要把图表撑破。最好一张图表反映一个观点,突出重点,让读者迅速捕捉到核心思想。
  • 第三,只选对的,不选复杂的。
  • 第四,一句话标题。

常见的图表类型选择:

3、警惕图表说谎

虚张声势的增长:人们喜欢研究一条线的发展趋势,例如股市、房价、销售额的增长趋势,有时候为了吸引读者故意夸大变化趋势,如图1通过截断数轴夸大增长速度,从正常数轴的图2看到增长是缓慢的。

3D效果的伪装:3D图形容易造成视觉偏差,如图1有3D效果,看上去 A->B->C->D->E依次递增,实际是D>E,要格外小心图表的伪装。

三、常见数据分析误区

“用数据说话”,已经成为一种流行语。

在很多人的心里,数据就代表着科学,科学就意味着真相。“数据不会骗人”,也成了说服别人时常用的口头禅,事实果真如此吗?让我们来谈谈那些常见的误区。

1. 控制变量谬误

在做A/B测试时没有控制好变量,导致测试结果不能反映实验结果。或者在进行数据对比时,两个指标没有可比性。举个例子,为测试不同营销时间点对下的转化的影响,但A实验使用短信营销、B实验使用电话营销,未控制变量(营销方式),导致实验无法得出结论。

2. 样本谬误

(1)样本量不够

统计学的基础理论基石之一就是大数定律,只有当数据量达到一定程度后,才能反映出特定的规律。如果出现样本量极少的情况,建议把时间线拉长,获得足量的样本。或者将不重要的限定条件去掉,增加样本数。

(2)存在选择性偏见或者幸存者偏见

统计学的另一大理论基石是中心极限定理。简单描述就是,总体样本中,任意一个群体样本的平均值,都会围绕在这个群体的整体平均值周围。

举个例子,在应用升级期间,衡量登录用户数、交易用户数等指标,来判断用户对新版本的喜欢是否优于老版本。听上去非常合理,但这里实际就隐藏了选择性偏见,因为新版本发布时,第一批升级上来的用户往往就是最活跃的用户,往往这批用户的指标较好,但不代表新版本更好。

(3)混入脏数据

这种数据的破坏性比较大,可能得出错误的结论。通常我们会采用数据校验的手段,屏蔽掉校验失败的数据。同时,在分析具体业务时,也要针对特定业务,对所使用的数据进行合理性限定,过滤掉异常离群值,来确保拥有比较好的数据质量。

3. 因果相关谬误

会误把相关当因果,忽略中介变量。比如,有人发现雪糕的销量和河溪溺死的儿童数量呈明显相关,就下令削减雪糕销量。其实可能只是因为这两者都是发生在天气炎热的夏天。天气炎热,购买雪糕的人就越多,而去河里游泳的人也显著增多。

4. 辛普森悖论

简单来说,就是在两个相差较多的分组数据相加时,在分组比较中都占优势的一方,会在总评中反而是失势的一方。

5. 个人认知谬误

主观臆断、经验当事实、个体当整体、特征当全貌、眼见当事实。

举个主观臆断的例子:某个产品A页面到B页面的转化率30%,直接判断为很低,推导出可以提高到75%。但实际类似产品或者用户行为决定页面的转化率就只有这么高,得出一个错误的结论。

标准至关重要,数据+标准=判断。有了判断才能深入分析。通过分组对比找标准(象限法、多维法、二八法、对比法),有标准通过分析对比,找到“好/坏”的点。

统计学规律和理论不会错,犯错的是使用它的人。因此,我们在进行数据分析时,一定要格外小心,错误的数据,披上科学的外衣,就很难分辨了。

可视化+数据+图表,报告规范这么写才能升职相关推荐

  1. 如何在 Vue 中使用 Chart.js - 手把手教你搭可视化数据图表

    本文首发:<如何在 Vue 中使用 Chart.js - 手把手教你搭可视化数据图表> 使用 Chart.js 在 Vue 搭建的后台管理工具里添加炫酷的图表,是所有数据展示类后台必备的功 ...

  2. 《快速掌握PyQt5》第三十六章 用PyQtGraph绘制可视化数据图表

    第三十六章 用PyQtGraph绘制可视化数据图表 36.1 下载PyQtGraph 36.2 基础知识与用法 36.3 将PyQtGraph嵌入到PyQt5中 36.4 小结 <快速掌握PyQ ...

  3. 设计灵感|移动应用的可视化数据图表都是怎么设计的?

    可视化数据图表承载着数据统计.展示数据变化等作用,不同的数据类型可以使用不同颜色甚 至不同的图表来表示,让用户更方便的理解每一个表盘的含义与信息. 可视化图表种类如此之多,什么场景下应该用什么图表展示 ...

  4. 可视化数据图表制作注意事项

    可视化图表,图形和仪表中的数据是使数字能够实际对话的最强大的方式之一.优秀的可视化报表绝对不是数据图表的堆叠,我们在做可视化报表时应时时考虑用户的体验,而不是"自嗨".数据可视化其 ...

  5. Excel中可视化数据图表制作要点有哪些?

    Excel中可视化数据图表制作要点有哪些? [导语]如果你想要成为一名合格的或者是优秀的数据分析师,不仅要能够准备完整分析数据,还要将数据分析结果可视化,图表制作是数据可视化必不可少的形式,那么Exc ...

  6. 前端开发之vue可视化数据图表组件(Chart.js)

    前端开发之vue可视化数据图表组件(Chart.js) 前言 制作好的效果图 vue2中使用Chart.js 1.在项目中安装Chart.js 组件 2.vue文件 vue3中使用Chart.js v ...

  7. 这份数据分析报告规范,写得很棒!

    作者:吴迪「趣店数据分析师」 来源:趣店技术团队 我是小z 能不能写一份优秀的分析报告,是衡量分析师是否牛X的重要标准. 除了不同场景下特定的分析逻辑,怎么把分析报告写的更好,其实是有成体系方法论的. ...

  8. python数据图表可视化GUI,python做可视化数据图表

    Python中数据可视化的两个库! 1. Matplotlib:是Python中众多数据可视化库的鼻祖,其设计风格与20世纪80年代的商业化程序语言MATLAB十分相似,具有很多强大且复杂的可视化功能 ...

  9. 《大屏可视化数据》该怎么设计?

    前言:数据可视化是什么?可视化数据有哪些主要特征?为什么要使用大屏展示可视化数据?数据可视化是综合运用计算机图形学.图像.人机交互等,将采集.清洗.转换.处理过的符合标准和规范的数据映射为可识别的图形 ...

最新文章

  1. webassembly类型_WebAssembly 那些事儿
  2. javascript --- 事件托付
  3. iOS7修改UISearchBar的Cancel按钮的颜色和文字
  4. layui循环数据并渲染_layui使用表格渲染获取行数据的例子
  5. 每日一皮:代码出现Bug的三种表情!
  6. 【响应式Web前端设计】在html页面实时显示系统时间
  7. Mac 下anaconda安装mysqldb的方法
  8. java-基础-ArrayList剖析
  9. 云计算实战系列四(Linux文件权限I)
  10. mysql client version_下载mysqlclient问题报错
  11. 安卓开发仿微信图片拖拽_Android 仿微信朋友圈发表图片拖拽和删除功能
  12. 电机功率与转矩/扭矩的关系
  13. 万网域名注册、域名解析与备案流程
  14. 方框加对勾怎么输入_Word怎么输入对号和方框对勾
  15. 3D 机器视觉应用并采用 DLP 技术的精确点云生成
  16. 3229: 硬币组合
  17. xss.haozi.me练习通关
  18. 计算机excel表格教程高级筛选6,#excel如何进行高级筛选?#excle高级筛选6
  19. [Shader]NGUI与灰化
  20. PDF文件简介及PDF文档加密方法

热门文章

  1. 微信小程序定义全局变量_微信小程序第二天学习内容分享
  2. linux网站465端口是什么端口,发送端口25,465,587端口疑问解答
  3. 互联网晚报 | 4月11日 星期一 | 苏州放宽住房限售;苹果确认开始在印度生产iPhone 13;民航局将上报民航专项检查方案...
  4. B端产品流程图一网打尽
  5. 中国剧本推理市场洞察2021
  6. 面试题,你是如何评判产品改版后的效果的?
  7. 如何给mac地址赋值_交换机工作基础——MAC地址表的构成与安全
  8. 作者:孟凡(1989-),男,中国科学院大学经济与管理学院、中国科学院大数据挖掘与知识管理重点实验室博士生...
  9. 作者:钱卫宁,华东师范大学数据科学与工程研究院教授、博士生导师。
  10. 【Groovy】Groovyc: Internal groovyc error: code 1 的解决方法