难倒95%数据分析师的面试题!
今天,从网上整理了11道数据分析面试真题,供大家参考学习~
01 统计学部分
1、一副扑克牌一共54张,平均分成2份,求这2份都有2张A的概率。
参考答案
先求分母:
54张牌,分成2份,每份应该27张。
第一步:我们从54张牌取27张,作为第一份,就是C(54,27)
第二步:剩下的27张牌取27张,作为第二份,就是C(27,27)
这样分母就有了:把第一步和第二步相乘,就是54张牌,随机平均分成2份的组合数量,因此分母= C(54,27)*C(27,27)
再求分子:
一副牌有4张A,50张非A的牌。
为了保证两份都要有2张A,在挑第一份的时候,应该先在4张A里面挑2个A,50张非A的牌里挑25个非A。然后第二份就是在剩下的2个A里挑选2个,25个非A里面挑25张。
第一步:从4张A里挑2张A,50张非A里挑25张,C(4,2)*C(50,25)
第二步:从2张A里挑2张A,25张非A里挑25张,C(2,2)*C(25,25)
分子:C(4,2)*C(50,25)*C(2,2)*C(25,25)
所以概率是:
C(4,2)*C(50,25)*C(2,2)*C(25,25) / C(54,27)*(C27,27)
=(27*13)/(53*17)
2、男生录取率增加,女生录取率增加,总体为何减少?
参考答案
此题考查的是辛普森悖论,因为男女的录取率可能有较大差异,同时低录取率群体的占比增大。
如原来男性20人,录取1人;女性100人,录取99人,总录取率100/120。
现在男性100人,录取6人;女性20人,录取20人,总录取率26/120。
即那个段子“A系中智商最低的人去读B,同时提高了A系和B系的平均智商。”
3、置信度与置信区间是什么意思?
参考答案
置信区间是我们所计算出的变量存在的范围,置信水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度。
举例来讲,如果我们有95%的把握,让真正的数值在我们所计算的范围里。
那么在这里,95%是置信水平,而计算出的范围,就是置信区间。
如果置信度为95%, 则抽取100个样本来估计总体的均值,由100个样本所构造的100个区间中,约有95个区间包含总体均值。
4、p值的含义?
参考答案
假设检验的基本原理只有3个:
一个命题只能证伪,不能证明为真
在一次观测中,小概率事件不可能发生
在一次观测中,如果小概率事件发生了,那就是假设命题为假
证明逻辑就是:
我要证明命题为真——证明该命题的否命题为假——在否命题的假设下,观察到小概率事件发生了——否命题被推翻——原命题为真
比如:要证明A是合格的投手——证明“A不是合格投手”这个命题为假——观察到一个事件(比如A连续10次投中10环),而这个事件在“A不是合格投手”的假设下,概率为p,小于0.05——小概率事件发生,否命题被推翻。
可以看到p越小——这个事件越是小概率事件——否命题越可能被推翻——原命题越可信
5、怎么向小孩子解释正态分布?
参考答案
先拿出小朋友班级的成绩表,每隔2分统计一下人数(因为小学一年级大家成绩很接近),画出钟形。然后说这就是正态分布,大多数的人都集中在中间,只有少数特别好和不够好。
拿出隔壁班的成绩表,让小朋友自己画画看,发现也是这样的现象;然后拿出班级的身高表,发现也是这个样子的。
大部分人之间是没有太大差别的,只有少数人特别好和不够好,这是生活里普遍看到的现象,这就是正态分布。
02 业务思维部分
1、卖玉米如何提高收益?价格提高多少才能获取最大收益?
参考答案
收益 = 单价*销售量,那么我们的策略是提高单位溢价或者提高销售规模。
提高单位溢价的方法:
品牌打造获得长期溢价,但缺陷是需要大量前期营销投入;
加工商品占据价值链更多环节,如熟玉米、玉米汁、玉米蛋白粉;重定位商品,如礼品化等;
价格歧视,根据价格敏感度对不同用户采用不同定价。
销售量=流量x转化率,上述提高单位溢价的方法可能对流量产生影响,也可能对转化率产生影响。
收益 = 单价x流量x转化率,短期内能规模化采用的应该是进行价格歧视,如不同时间、不同商圈的玉米价格不同,采取高定价,然后对价格敏感的用户提供优惠券等。
2、店铺销售额降低如何分析?
参考答案
先定位问题:运用多维度分析法和七何分析模型定位到异常现象。
拆分维度有:
who:用户(新用户/老用户、渠道、画像等)
when:访问时段
where:产品(产品类型)
然后拆分问题:运用多维度分析法从指标构成拆分。
销售额=浏览量转化率客单价
销售额=GMV-取消订单金额-退货订单金额
假设检验:确定问题源头,分析原因,提出假设再验证,再假设再验证
可以从以下角度提出假设:
内部原因:产品、价格、渠道、促销(4P营销理论)
外部原因:政治、经济、社会、技术(PEST分析)
3、若用户留存率下降如何分析?
参考答案
先定位问题:运用多维度分析法定位到异常现象发生的具体位置和程度。
拆分维度有:新用户/老用户、渠道、画像(用户特征)等,分析不同维度下的用户留存情况、定位到问题人群。
然后假设检验:提出假设再验证,再假设再验证
内部:用户获取及激活(AARRR模型)、产品
外部:PEST,主要考虑竞品影响
4、我们有一款游戏收入下降了,你怎么分析?
参考答案
两层模型:细分用户、渠道、产品,看到底是哪里的收入下降了
指标拆解:收入 = 玩家数量 * 活跃占比 * 付费转化率 * 付费次数 * 客单价
进一步细分,如玩家数量 = 老玩家数量 * 活跃度 + 新玩家数量 * 留存率等。然后对各个指标与以往的数据进行对比,发现哪些环节导致收入下降
原因分析:a. 内部:产品变化、促活活动、拉新活动、定价策略、运营策略、服务器故障等
b. 外部:用户偏好变化、市场环境变化、舆论环境变化、竞争对手行为、外部渠道变化等
如何提高:基于乘法模型,可以采用上限分析,从前往后依次将指标提升到投入足够精力(假设优先分配人力、经费与渠道)后的上限,然后分析“收入”指标的数值提升。找到数值提升最快的那个阶段,就是我们提高收入的关键任务。
03 数据挖掘部分
1、数据库与数据仓库的区别
参考答案
简单理解下数据仓库是多个数据库以一种方式组织起来,数据库强调范式,尽可能减少冗余;而数据仓库强调查询分析的速度,优化读取操作,主要目的是快速做大量数据的查询。
数据仓库定期写入新数据,但不覆盖原有数据,而是给数据加上时间戳标签;数据库采用行存储,数据仓库一般采用列存储。
数据仓库的特征是面向主题、集成、相对稳定、反映历史变化,存储数历史数据;数据库是面向事务的,存储在线交易数据。
2、什么是聚类分析?
参考答案
聚类分析是一种无监督的学习方法,根据一定条件将相对同质的样本归到一个类总。
聚类方法主要有:a. 层次聚类 b. 划分聚类:kmeans c. 密度聚类 d. 网格聚类 e. 模型聚类:高斯混合模型
来 源:成都数据分析
NO.1
往期推荐
Historical articles
Python 数据可视化全方位讲解,建议收藏
整理了10个经典的Pandas数据查询案例
用Python绘制了几张有趣的可视化图表
20个数据分析师必知必会的SQL查询语句
长按
难倒95%数据分析师的面试题!相关推荐
- 阿里巴巴2011数据分析师实习生笔试题
职位名称:数据分析师 招聘人数:若干 [职位描述] 1.负责业务数据收集整理,对多种数据源进行深度诊断性组合分析.挖掘.深度分析和建 模 2.提供效能报告,对市场活动终端体现给予评估,为公司运营决策. ...
- 数据分析师-SQL笔试题-做透这道题就够了
笔者在求职数据分析师岗位时,在知乎上看到了一道非常经典的SQL题,问题来源: link.笔者认为彻底的搞懂这道题以及涉及的知识点,能够通过绝大部分数据分析岗位的SQL笔试.下面是这道题的问题及解答,答 ...
- 数据分析师常见面试题.
1.成为一名数据分析师需要具备哪些技能? 要成为一名数据分析师,需要掌握丰富的报告软件包(Business Objects),编程语言(XML,Javascript或ETL框架),数据库(SQL,SQ ...
- CPDA : 数据分析师常见面试题
1.成为一名数据分析师需要具备哪些技能? 要成为一名数据分析师,需要掌握丰富的报告软件包(Business Objects),编程语言(XML,Javascript或ETL框架),数据库(SQL,SQ ...
- 面试题 I 28道数据分析师经典面试题!
- 点击上方" i小码哥"订阅我吧!- 偏统计理论知识 1. 扑克牌54张,平均分成2份,求这2份都有2张A的概率. M表示两个牌堆各有2个A的情况:M=4(25!25!) N表示 ...
- 数据分析师python笔试题_腾讯2020春招数据分析师第一轮线上面试笔试
面试部分 和我一起参加此次腾讯2020春招的人似乎都是留学生,整个流程就是先自我介绍,然后 选择三个题(线上笔试题前三道)进行回答,每个人5分钟,形式是线上面试,在面试之后直接线上作答笔试部分时间大概 ...
- 数据分析师python面试题_数据分析师面试题
[120] agree_group city_id city_name year level type area 0 南昌市 36 兰州市 2006 三级 商业 用地 0.02778 1 南昌市 36 ...
- 【牛客】网易2018实习生招聘笔试题——数据分析师实习生解析
[牛客]网易2018实习生招聘笔试题--数据分析师实习生解析 * 选择题根据牛客网下方讨论整理,三道大题均为自己答案,欢迎大家讨论并给予指正. (https://www.nowcoder.com/te ...
- python 笔试题 英方_4000字转型数据分析师笔试面试经验分享
大家好,我是戴师兄~ 在上一篇文章中我分享了快速自学数据分析的经验. 本篇文章,我将跟大家分享下我的笔试和面试心得. 开头先说说我转型前的职业背景: 想看笔试面试经验的同学萌可以直接跳过这一段~ 20 ...
最新文章
- instancesRespondToSelector与respondsToSelector的区别
- A definition for the symbol 'symbolName' could not be located
- 201521123038 《Java程序设计》 第十周学习总结
- csv中包含多余换行符_Python3爬虫之猫眼电影TOP100(requests、lxml、Xpath、CSV)
- Java 计算数学表达式(字符串解析求值工具)
- SCCM 2012 R2 从入门到精通 Part8 软件部署
- 谈谈物联网产业4G转型中的隐忧与应对
- 帝骑k触屏模拟器_假面骑士decade神主牌模拟器手机版下载|
- java楼盘管理系统_课内资源 - 基于Java面向对象开发的房屋中介管理系统
- 【线性代数笔记】正定矩阵及其性质
- 【python】pdf转png
- android蓝牙门禁,1号社区APP互联门禁产品新开门方式说明
- 基于Visual C++2010 与office2010开发办公自动化(2)-自动生成excel与word并打开
- AFN(上传、下载)
- 2020计算机考研985,2020考研:这几所985一个A+学科快来看看吧
- linux在电子信息工程行业中的应用,电子信息工程与应用子技术就业方向.doc
- R3300L运行CoreELEC, EmuELEC和Armbian
- CVPR 2018 | 腾讯AI Lab关注的三大方向与55篇论文
- 矩阵之矩阵乘法(转载)
- 遇见逆水寒最新服务器是哪个,遇见逆水寒合服公告 遇见逆水寒旧服账号还在吗...
热门文章
- mysql 挑战握手协议_[中文协议]PPP挑战握手认证协议(CHAP)
- 山东大学往年c语言期末试题及答案,山东大学历年C语言题库.doc
- 力扣:377. 组合总和 Ⅳ
- 第二章 预习导图 部署DNS服务
- Elixir服务器接收客户端消息01
- 【Python】位运算(按位与 、按位或 |、左移位运算符 <<(相当于乘以2)、右移位运算符 >>(相当于除以2))
- 备战Noip2018模拟赛3(B组) T2 Dance 开场舞蹈
- 洛谷 P4315 月下“毛景树”(边树剖)
- 【校招VIP】出品:产品在线实习“职查查”大V信息认证实战
- 用Python和类的方法模拟新浪微博的批量虚假粉丝