咱们先来设想一个场景,一个会议室里坐满了人,正在做报告的年轻人西装笔挺,头发书的一丝不苟,PPT上列满了数据和图表,他正在论证一个什么东西。年轻人讲了很多,可是在台下听报告的一个穿着随意的大佬,有点不耐烦了:“你不用说那么多,我就问你几个问题。”

大佬问了几个问题,年轻人马上被难住,于是大佬否决了年轻人的整个方案。

我们对这个场景并不陌生,这可能是一次数据分析会,一次跟主管的建模方案汇报,或是你去见一个客户汇报成果,在一线做事的人用了很多精力专注于各种细节,这在数据分析师和建模师身上表现尤为明显,可是大佬想问问题却往往是写意的-他们三言二语就能发现问题的关键,并以此做出决策,然后事实证明大佬们说得对。

这就引出了一个问题,有些人数据分析做过大量功课,熬了一周甚至一月,掌握了丰富的数据和资料,为什么他们的决策水平,反而不如大佬们短短时间内的快速判断呢?难道说,对一个问题思考得多,反而没好处吗?

这个问题,其实数学家早就想明白了,可以用建模中的“欠拟合“和”过度拟合”这两个概念来形象的比喻。

欠拟合其实很好理解,就是指学习的不够,只把样本数据的部分特征习得了,或者样本变量本身就不够,然后得出以偏概全的结论,盲人摸象这个成语最形象的表达了欠拟合,大佬经常一针见血,是因为有经验的人在其专业领域模式识别、见微知著的能力远超常人,这也是很多决策领域机器搞不过人的一个原因。

过拟合就是指把学习进行的太彻底,把样本数据的所有特征几乎都习得了,于是机器学到了过多的局部特征,过多的由于噪声带来的假特征,造成模型的“泛化性”和识别正确率几乎达到谷点,于是你用你的机器识别新的样本的时候会发现就没几个是能正确识别的,过于精确写实往往丢失事物的本质特征。

打个形象的比方,给一群天鹅让机器来学习天鹅的特征,经过训练后,知道了天鹅是有翅膀的,天鹅的嘴巴是长长的弯曲的,天鹅的脖子是长长的有点曲度,天鹅的整个体型像一个“2”且略大于鸭子.这时候你的机器已经基本能区别天鹅和其他动物了,然后,很不巧你的天鹅全是白色的,于是机器经过学习后,会认为天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会认为那不是天鹅,前面的规律是全局特征,所有的天鹅都有的特征,是对的。

然而,天鹅的羽毛是白的只是局部样本的特征,机器在学习全局特征的同时,又学习了局部特征,这才导致了不能识别黑天鹅的情况。

经常听数据分析师唠唠叨叨一大堆,陷入细节而不可自拔,是时候祭出这张图片了,领导要的可不是那个你自己想象出来的猫!

因此,如果你的数据分析涉及决策判断和预测未来,那么就可能有这两个根本问题,那么,如何避免这两种尴尬的状态呢?

针对欠拟合,笔者认为需要有效利用群体智慧的力量,其实笔者在最早的一篇微信文章《六脉神剑?大数据时代下经营分析师的挑战》提到过这个方法:

大多数据分析师(无论是经营分析师,数据分析师或者数据建模师等等)都是孤独的,在面对一个新的分析课题时,总会面临着对新形势的莫名紧张,加班加点是常有的事,而且感觉分析的事情很难分享和合作。

但由于每个人的能力和视野有限,因此分析欠拟合现象很普遍,也很正常,不是没考虑这点就是那点,但一篇报告要过大佬的关,往往需要做到滴水不漏。

那个时候,三个“臭皮匠”往往是有效的,很多专业公司来企业做咨询方案,后援团队会非常强大,这可不仅仅是气势问题,Google公司在它的How Google works提了一个观点,大家所以汇聚到公司来上班,是因为合作能让创意更好的迸发,创意精英聚在一起,能够产生巨大的化学反应,这是团队所以存在的根本,这个理念对于分析师团队同样适用,对于分析师来说,即使是1+1>1.5,也是可以接受的。

创新的组织,比如大数据组织,应该为分析师创造新的合作环境,每个分析师都应该以开放的心态接纳他人,连接,是新时代的需要,对于分析这个东西,需要的是更广的视野,更深的思考,更多的角度,再强的个人总会有没有想到的角度,如果企业的分析总是受限于个人视野,何来持续竞争力?

笔者以前有多次与团队成员连夜写分析报告的经历,有一次跟有才(同事绰号)临时接到一个过度优惠的分析报告任务,当天下午布置,第二天上午部门就要提交,怎么办?

咱俩就充分发挥协作的力量,充分讨论,直到每个结论双方都找不到明显的暇纰为止,第二天上午一次过关,笔者将这个归结为团队的力量,在这个开放、分享、透明的年代,数据分析师一定要怀有谦卑的心态,敞开胸怀迎接他人,个人英雄主义很难有市场。

针对过拟合,数据分析师除了提升自己的业务能力和换位思考的能力外,现实中可以采取多人交叉分析验证的方法来避免个人局限性,当然这个代价是有点大的,这里给出三个执行性建议。

第一,限定分析时间,写报告时间越长,边际效益越低,30天写出的东西往往跟一周相差无几,反而是在有时间限制的情况下,你才会逼着自己去考虑最重要的因素,或者干脆先找大佬或他人商量下。

第二,限定内容长度,领会电梯谈话的精髓,你的结论如果一页讲不清楚,你就应该考虑有没有抓住问题的核心,很多时候大佬没那么多时间,往往是直接先看结论再看论据的,结论不吸引人再多的数字都没意义。

第三,找个白板讨论,这是他人的一个建议,要使用粗的马克笔,笔画越粗,对你的思维越有利,越能逼着你去考虑大局,有个词叫作蜡笔效应。

笔者用欠拟合和过拟合来表达数据分析中的困境,可能并不是很适合,但道理就是那些道理,希望于你有些启示。

为什么你的数据分析报告,总被领导打回?相关推荐

  1. 如何做好数据分析报告(一)

    很多人进行数据分析工作的时候,做出了数据分析结果,就以为数据分析工作结束了.其实并非如此,数据分析工作的解释需要我们做一份数据分析报告.当然,数据分析报告不是一个简单的事情,需要我们做到从头到尾都能够 ...

  2. 掌握5个核心要点,做一个高质量的数据分析报告

    作为职场人,在日常工作中肯定少不了要写月报.年报等各种分析报告.虽然时下数据分析已成为人人必备的技能,但不会写数据分析报告的人还是很多,大多数人的通病是分析报告只是呈现数据.罗列事实,但却没有结论,或 ...

  3. 数据分析报告,就该这么写!超详细攻略奉上

    临近年底,做数据分析的同学们都在写各种报告.按理说,写数据分析报告是数据分析师最基本的技能,人人都该会.可怕就怕,自己辛辛苦苦写完的东西没!人!看!没人看还是好的,更怕的是 在接到众多同学求助之后,今 ...

  4. 数据分析报告,就该这么写

    很多同学喜欢问:有没有数据分析报告模板可以抄.其实如果掌握了写报告的方法,根本不需要模板抄.而所谓的模板,为了图高大全,往往章节很多很多很多.真实工作中真这么汇报估计既把自己累死,又把听报告的急死.今 ...

  5. 数据分析报告的7个模块

    1. 标题封面 一个好的标题,能让读者在看到报告的一瞬间就产生阅读的欲望,也能让读者迅速理解报告的主旨 标题一般要符合 SPA 原则: (1)简单明确 Simple (2)利益相关 Profit (3 ...

  6. 2018年8月以太坊DApp数据分析报告

    近日,链塔数据BlockData发布了<2018年8月以太坊DApp数据分析报告>,报告显示,以太坊上的DApp数量多达775个,形成了一个较为完善的开发生态圈,累计交易笔数多达3.003 ...

  7. 产品经理经验谈50篇(二):如何写好一份规范的数据分析报告?我想你需要知道这些

    01 结构规范及写作 报告常用结构: 1. 架构清晰.主次分明 数据分析报告要有一个清晰的架构,层次分明能降低阅读成本,有助于信息的传达.虽然不同类型的分析报告有其适用的呈现方式,但总的来说作为议论文 ...

  8. sql能查到数据 dataset对象里面没有值_新零售数据分析报告

    零售项目数据分析报告 一.项目背景 随着零售市场的竞争日趋激烈,在试图满足客户期望时,最优化服务业务流程的能力是最重要的.通道化和管理数据,以争取客户的利益以及创造利润为目标,对生存至关重要. 理想情 ...

  9. 如何查询一个表中除某几个字段外其他所有的字段_一个小故事告诉你:如何写好数据分析报告?...

    关注并将「人人都是产品经理」设为星标 每天早 07 : 45 按时送达 给你一份数据,你能完美的出一份数据报告吗?本文结合一个小故事,来告诉大家如何写好一份数据分析报告,enjoy~ 作者:Haby ...

最新文章

  1. IIS 7.5 + FastCGI + PHP + Drupal 7 + Oracle
  2. Linux中压缩、解压缩(tar/zip/bzip2/gz/gzip/zip)
  3. boost::math模块实现图表显示使用 Lambert W 函数计算电流的测试程序
  4. 对require四种引入方式的认识
  5. modbus poll\slave
  6. 网页制作中如何自定义网页图标
  7. [html] 如何在网页中嵌入公司地址的地图?
  8. vue 非es6 写法怎么按须加载_Vue源码必学指南:flow(语法检查)以及rollup(模板打包)...
  9. 基于matlab的pcb焊盘,EDA复习题
  10. leetcode 1223 python
  11. TextView settextcolor 无效解决方案
  12. mockjs的介绍、基本使用和封装
  13. java 数组有序_Java有序数组
  14. 安卓+七牛云的第三方图片存储实践
  15. style常见的样式属性
  16. 【软考-中级】系统集成项目管理工程师-【3信息系统集成专业技术知识】
  17. C语言学习(2):enum枚举时出现的问题:
  18. BUU_re_[ACTF新生赛2020]rome
  19. matlab 函数 平移,MATLAB图线先下平移
  20. 租房时代,K2 BPM软件带你拥抱更好生活

热门文章

  1. c++输入文件流ifstream用法详解
  2. JVM类加载机制-面试
  3. 2021年最新Java高级面试题+答案
  4. ArcBlock 分享 | 多数人只关注眼前赛道的大小,而忽视了变化
  5. Vega 数据分析图表
  6. 授您以鱼,不如授您以渔
  7. 【闲谈】第一份实习(上)
  8. Qt6STL-QMap分析
  9. 女生选择学UI设计好么 学UI具备哪些天然优势
  10. 2020-08-20 解决程序出现无法启动的问题(0x000007b等)