聊聊数据分析中常问的估算问题,有方法论吗?
\
公众号后台回复“图书“,了解更多号主新书内容
作者:Keivan Chan
来源:97年陈伯伯
看了大厂数据分析面试题以及自己以前面试的过程中,发现估算题目出现的概率蛮大。面试官都喜欢问应试者这样的一些问题:
"'
估算北京租赁市场规模;
估算一个城市的加油站;
估算离你宿舍最近的食堂一天营业额是多少;
估算你的城市现在运行着多少量公交车;
"'
作为没有接触过的同学,面对这种问题就会比较懵,可能会说去搜索资料,去做实地统计调研,但是在面试这么短的时间内,其实面试官希望看到的是你的拆解逻辑,并不一定需要你去得出最后准确的答案;
虽然我们聊的是估算问题,但是这类问题常见于面试过程中,那么我们先聊聊面试,面试官问这类问题,他的考察点是啥?希望能帮助到有需要的朋友;
1. 清晰的思路:估算的每一步都需要逻辑清晰、思路明确,要把一个复杂的问题拆解成多个简单的元素,并且有效的把这些元素组合起来。
2. 清楚的表达:能把自己的想法明明白白地传达给面试官,让面试官也理解你是怎么思考和处理这个问题的。
3. 准确的计算:数据分析无法避免和数字打交道,对数字的敏感和比较强的计算能力也是必要的。当然,这些计算仅限于加减乘除。
4. 必备的常识:估算少不了假设,而假设大多基于面试者的常识。有些公司甚至会不止希望做到有常识,而是希望看到良好的“商业嗅觉”。
聊完面试,再来聊聊怎么去思考解决这类问题;
一、费米估算
首先讲一个理论:费米估算
有这样的一个故事
在一次芝加哥大学课堂上,费米问学生。芝加哥市有多少调琴师,学生们一脸茫然。费米提示把这个问题“分解成一些便于操作的小问题,然后鼓起勇气作猜测和假设”。
芝加哥有多少居民?可靠的估算是300万;平均每个家庭有多少人?4人;多少家庭有钢琴?大概三分之一,那么全市大约就有25万架钢琴;一架钢琴隔多长时间需要调音?平均5年,那么芝加哥平均每年有5万架次的钢琴需要调音;每个调音师每天能为多少架钢琴调音?4架;假设他一年工作250天,那么他每年约为1000架钢琴调音。由此,费米和学生们推测,芝加哥市大概有50位钢琴调音师。
事后有人用电话号码簿加以验证,实际统计的结果与费米的猜测十分接近。
我们面试中的常见的问题,也是跟费米问题十分接近;
费米问题中的原理:
费米估算指的是解决未知结果的估算问题,将复杂的问题拆解成小的、可知结果的部分。将拆解出来的简单部分赋予实际意义,如果还不能得出结果,那就继续再拆解,直到拆解后的所有部分问题变成一个常识问题或者是比较容易解决的,从而将一个未知结果的问题逐步变得清晰。
在将复杂的问题拆解成小的、可知结果的部分过程中,可能会存在估算,那么这样的估算会不会给最终结果带来很大的误差呢?
其实在费米估算过程中,我们不是只有一次估算,我们会产生一系列的估算。比如估算芝加哥有1/3家庭有钢琴,同时也会估算一架钢琴平均5年调一次音。这些估算有的过高有的过低,相乘之后会相互抵消,回归到较为准确的平均值。即是平均律;当然,费米估算有个很重要的前提,我们的估算值是有实际数据或者生活经验支撑的。
这也就是为什么费米估算法会百试百灵,准确率十分之高了!
二、总结一下
费米估算其实将复杂的问题拆解成小的、可知结果的部分。将拆解出来的简单部分赋予实际意义,并进行估算,后面进行验证的这么一个过程;
记住绝大多数估算的 case 都至少有两种思考方式:从 Demand Side ,或者 Supply Side 。
狭义的来说, demand side 就是从需求的角度来考虑(估算的时候认为:市场/客户的需求有多少,规模就有多大,即需求决定了量,生意是供过于求的)而 supply side 就是从供给的角度来思考(估算的时候认为:商家能供给多少,数量就有多少,由供应决定了量,是供不应求的)。
广义地来看,demand side 就是从销售发生的角度来考虑,supply side 就是从真实存在的角度来估算。这两个概念我认为并不需要分的特别清楚。而且对于一个具体问题该从哪个角度出发还是很好判断的。不过,从我个人的经验来看,80%以上的估算还都是会希望 candidate 先从 Demand Side 来出发的。
解决这类问题的步骤:
1.明确问题
2.分析是需求端问题还是供给端问题,或者两个角度都不是
3.问题拆解,列公式
4.估计计算
5.实际验证
三、案例分析
从需求和供给分别拆解,相互补充交叉验证;
◆ ◆ ◆ ◆ ◆麟哥新书已经在京东上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前京东正在举行100-40活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码:
猜你喜欢
● 卧槽!原来爬取B站弹幕这么简单● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗
聊聊数据分析中常问的估算问题,有方法论吗?相关推荐
- java面试 设计模式_Java面试中常问到的设计模式
面试中常问到的设计模式 什么是设计模式? 设计模式是世界上各种各样程序员用来解决特定设计问题的尝试和测试的方法.设计模式是代码可用性的延伸 单例模式 保证被创建一次,节省系统开销 饿汉式:上来不 ...
- java io bio nio面试题_漫画:一文学会面试中常问的 IO 问题!
原标题:漫画:一文学会面试中常问的 IO 问题! 作者 | 漫话编程 责编 | 伍杏玲 本文经授权转载自漫话编程(ID:mhcoding) 周末午后,在家里面进行电话面试,我问了面试者几个关于IO的问 ...
- 计算机专业考研面试时老师会问什么问题,计算机考研复试面试环节中常问10个问题...
考研成绩公布时间日益临近,分数固然重要,但你的焦急不会让分数提高.但是复试同样决定生死.那复试中老师问及的问题该如何回答,又暗含哪些考查目的呢?一起了解下.小编为大家精心准备了计算机考研热门高校备考指 ...
- 面试中常问的List去重问题,你都答对了吗?
面试中经常被问到的list如何去重,用来考察你对list数据结构,以及相关方法的掌握,体现你的java基础学的是否牢固. 我们大家都知道,set集合的特点就是没有重复的元素.如果集合中的数据类型是基本 ...
- 去重 属性_面试中常问的List去重问题,你都答对了吗?
面试中经常被问到的list如何去重,用来考察你对list数据结构,以及相关方法的掌握,体现你的java基础学的是否牢固. 我们大家都知道,set集合的特点就是没有重复的元素.如果集合中的数据类型是基本 ...
- post大小限制_作为一个程序员,面试中常问的get和post的区别,你真的知道吗
作为一个程序员无论是搞前端的还是搞后端的,只要问起来GET和POST的区别,都能说出来个一二三四来. 你可能自己写过无数个GET和POST请求,或者也看过很多权威网站总结出来的区别,你非常清楚的知道什 ...
- 漫画:一文学会面试中常问的 IO 问题!
作者 | 漫话编程 责编 | 伍杏玲 本文经授权转载自漫话编程(ID:mhcoding) 周末午后,在家里面进行电话面试,我问了面试者几个关于IO的问题,其中包括什么是BIO.NIO和AIO?三者有什 ...
- php mysql设计中常问_PHP开发中常见的设计模式
一.工厂模式 工厂模式是我们最常用的实例化对象模式,是用工厂方法代替new操作的一种模式. 使用工厂模式的好处是,如果你想要更改所实例化的类名等,则只需更改该工厂方法内容即可,不需逐一寻找代码中具体实 ...
- 面试中常问多线程相关的知识,在工作中到底用在哪里呢?
求职面试中,面试官问到了高并发相关问题,该怎么办? 如果在求职面试的过程中,面试官问了你这个方向的问题,那你必须打起十二分的精神来回答这个问题,毕竟在各大厂招聘的JD中都提到了求职者具备[高并发经验] ...
最新文章
- Apache的shiro获取当前Session的方法
- C++ deque方法
- listen函数与海量用户同时登陆
- python爬b站评论_Python爬虫入门教程 32-100 B站博人传评论数据抓取 scrapy
- librosa能量_语音MFCC提取:librosa amp;amp; python_speech_feature(2019.12)
- java日期大小比较
- 瑞士科学家造出了撞不坏的无人机丨Science Robitics
- linux网络对时命令
- python内置函数用来返回序列中所有元素之和_Python内置函数——compile
- 代码规范(Sonar, P3C)
- windows 在一个文件夹打开cmd的方式
- 盘点CSV文件在Excel中打开后乱码问题的两种处理方法
- Tiptop CR报表axcr700采购入库月报增加tlf99“多角贸易序号”,部分资料无数据修复4gl文件bug
- 如何初始搭建vue2.x项目(vue3.x请走开)
- 大学生学剪辑蒙太奇技巧怎么用?
- 改变人生的100句箴言
- 利用JWT安全验证(前后端分离,单点登录,分布式微服务)
- 2022/10/10-10/15周报
- [水晶报表]水晶报表数据库登陆问题
- python:实现对图像进行色调处理算法(附完整源码)