面试过一些人,也被人面试过,今天我来谈谈对数据分析岗位面试准备的理解,特别是互联网行业面试考察的主要方面,以及如何快速准备。注意,面试准备大体上仅针对面试,并不会涵盖数据分析全方面的知识体系,特此建议初学者经过系统化学习后,再进行相关面试准备。

在大家开始找工作之前,至少留出2周时间进行知识梳理及过往经验总结,系统化处理碎片信息。面试准备时间过长的话容易导致疲惫,过短则可能准备不充分,大家一定要按照自己的实际情况进行安排。注意,本篇仅适用于0-5年数据分析师哦。以下分几个方面来讲讲数据分析的面试准备。

一、统计学

统计学基础对于数据分析师来说非常重要,寻找指标之间的相关性、设计ab测试、显著性检验、结果分析、预测建模等都需要一定的统计学知识,所以建议复习高频知识点。

高频考点

1、统计推断:置信区间、假设检验(t检验、z检验、卡方检验),几种检验方法的差异性及适用条线、p值的概念、检验样本选取、统计量等概念,参考《一篇搞懂假设检验》

2、几种常用概率分布(二项分布、泊松分布、正态分布和指数分布等)

3、大数定律、中心极限定理等

4、概率与抽样

5、异常值检测、归一化标准化等

6、常见统计分析模型:相关分析、回归分析、方差分析、因子分析等

推荐复习资料:《白话统计学》《商务与经济统计》

二、编程能力类:sql+python

互联网数据分析师岗位编码能力考察通常是sql+python,R语言较少考察。对于分析师来说,sql是一切分析工作的基础。Sql的考察形式一般为当场出1-2道场景题目。而Python在业务类分析师的面试中通常不会考到。

高频考点:

1、sql开窗函数:函数名(列名)OVER(partition by 列名 order by列名)、row_number、rank、dense_rank三个函数排序的区别

2、表关联:left join 、right join、join

3、having、where

4、数据倾斜问题如何优化

5、Python:循环、字典、字符串等

推荐复习资料:不推荐《sql必知必会》这本书,推荐大家直接在网上搜题目来练习,例如在牛客网sql刷题。

三、项目经历类

项目是数据分析岗位考察的重点,是最能考察候选人对业务的熟悉程度、思考深度、思维方式以及对自己工作的梳理总结的一个环节,可能面试中60%的时间都在聊项目。准备面试的时候最好完整梳理至少两个过往所做的项目,项目选取尽量选择完整性高、参与度深、成果好的。我认为需要重点梳理以下几个点:

1、项目背景、规模、涉及人数部门、项目角色(owner、参与者)

2、行动计划、抓手

3、过程中的效果衡量指标

4、项目中遇到的困难及如何解决

5、项目后续是否有迭代优化,基于什么考虑

6、项目做完后具体带来的价值,解决了什么问题(尽量量化指标)

7、项目结束后的反思,方法论沉淀

8、数据分析能力在这个项目中的体现

建议大家将自己的项目按以上几个维度去梳理,在面试的时候不要将以上几点一气说出,例如4、5、7比较适合留给面试官来进行项目深挖提问。在叙述中,注重逻辑性及条理性,清晰表达,着重体现自己的分析能力和最后取得的成果。

一些小伙伴的工作比较琐碎,没有经历过比较完整体系化的分析项目,那么可以着重梳理自己工作中的重点产出,解决过什么问题,将自己在过程中的思考方式进行总结,毕竟分析师最核心的能力不仅是‘分析’,还有‘把事儿做成’,所以照着这个方针,去说说你是如何解决问题,把事儿做成的。

四、分析思维

分析思维指的是数据分析常用方法论,比较常见且重要的分析方法和场景有:漏斗分析、分类分析、用户路径分析、A/B实验、roi分析、ltv分析、分层分析、流失分析、留存分析等。通常面试不会直接问分析方法论,而是会出一些开放性问题去考察应试者的分析思维。

高频考点:

1、指标异常波动分析

参考《dau日活下降,我该如何分析》这篇文章,核心要点:1)确认数据异常真实性,排除bug、数据统计问题等影响 2)先沟通,确立几个核心异常假设,再进行数据验证3)列出公式,多维度层层拆解下钻,计算影响系数,定位问题

2、ab实验

依据所面试的产品情况和岗位jd可以推断面试是否会考察ab实验的知识,通常强依赖推荐算法、策略的产品驱动的公司考察可能性会很高,例如:探探、头条、腾讯等公司。参考《AB实验你要知道的都在这里》。ab实验核心以下几个基础知识点:

1)ab实验的背后统计学原理,即假设检验、中心极限定理等

2)如何确定实验样本量:根据指标的base值和两组指标的差异、指标方差、检验的显著性水平(默认0.05)、统计功效(默认80%)等几个维度指标来确定实验样本量。

3)先通过低代价小流量的实验,逐渐推广到大流量用户。不同版本不同方案在验证时,要保证其他条件一致

4)分组确保用户特征均匀,如需要可采用分层抽样。如实验交叉,可采用正交分层的方法排除实验间的影响。

 

3、数据指标、监控体系

指标体系是几乎每家公司每个产品都会做的,是一切分析工作的基础。面试时考察到指标、监控体系搭建的可能性非常高。参考《数据指标体系搭建流程》这篇文章,核心要点1)梳理业务流程 2)收集需求、根据指标框架进行拆分,确定统计维度粒度 3)整理底层储存逻辑、可行性输出

推荐复习资料:分析思维不是一朝一夕可以突飞猛进的,需要日常的积累。但可在面试前看一些总结性的文章、书籍,例如《精益数据分析》、小洛的公众号(小洛公众号上面的文章基本都是属于分析思维、分析方法论这方面的干货)

六、针对面试岗位的特定准备

做面试准备不仅需要总结自己过去经验,且需要根据面试公司、产品、分析方向的不同,来进行一些针对性的准备。需要了解该业务的产品逻辑、商业模式、常用数据指标以及该业务类型的常用分析方法。例如面试增长数据分析师,需要了解常用的增长策略和增长模型,渠道拉新roi ltv、用户画像、ab实验等分析方法。在面试的时候,可以谈谈自己对该业务的了解,自己的过往经验可以帮对方解决什么问题,如果入职可以从哪方面来开展工作等方面,向面试官展示自己对该职位的诚意和匹配度。

本篇所提到的知识点肯定不会涵盖所有面试考察点,但是只要提到,都是重中之重。希望可以给想要看机会,但是对如何准备缺乏头绪的大家提供一些复习思路。

最后,欢迎大家关注我的公众号,祝大家面试顺利!

数据分析岗位面试准备请看这篇!相关推荐

  1. 面试官教你 ,如何应对秋招面试(不看后悔篇)!!!

    前言 又到了每年的毕业季,应届毕业生在找工作过程对于简历设计和面试技巧有一定的欠缺,这对于求职是比较重要的两个因素,因此掌握一定的面试技巧对于找互联网技术岗位的工作帮助非常大.本篇文章给大家分享一波职 ...

  2. 本地计算机用户改名,win10本地账户管理员怎么改名,详细操作步骤请看本篇

    win10用户能否将桌面上的Administrator管理员账户名(即Administrator文件夹名)更名为自己的名字,使自己的电脑更具有个性?答案是肯定的.哪如何实现呢?请看下面具体的操作步 聚 ...

  3. 【机器学习】如果你不了解机器学习的简史,请看这篇文章

    编译:伯乐在线 - 李大萌,英文:Eren Golge [导读]:全面介绍机器学习发展的历史,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.Deep Learning. 自科学技术和 ...

  4. GitHub 3W 星,冲击热榜!超实用技术面试手册,看这篇就够了

    安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 技术人员求职面试,单刷leetcode上的大厂题库可能还不够. 简历怎么写才能吸引HR的眼光,可能会被技术老大问到哪些常见问题,拿到Offe ...

  5. Snovio软件怎么用?请看这篇邮件群发平台使用指南

    在本文中,我们将为您提供分步指导,使用Snovio邮件群发软件(https:www.snovio.cn)并构建自己的自动化邮件营销-从收集客户邮箱地址到启动针对目标客户的复杂序列邮件,所有这些都在一个 ...

  6. 吹牛前请看这篇:“智能”物流 VS “智慧”物流

    导语 大家好,我是智能仓储物流技术研习社的社长,老K.当今社会,处处在谈人工智能.智能制造,在仓储物流圈内,有人谈的是智能物流,有人谈的是智慧物流.究竟该怎么区分两者呢?下次饭桌和人吹牛时,建议您读读 ...

  7. 香港优才计划最新评分表,申请请看这篇干货!

    香港优才评分表细则 要想申请香港优才,首先要做的就是用优才评分表去测评你目前的个人条件能否符合香港优才的申请条件.打分表的分数越高,申请就会越有优势.当然,如果个人某方面的能力突出,或者是属于香港紧缺 ...

  8. 推荐系统(五)——SIGIR‘21用反事实推断缓解点击诱饵,还在为标题党烦躁吗?请看这篇文章

    Clicks can be Cheating: Counterfactual Recommendation for Mitigating Clickbait Issue https://dl.acm. ...

  9. 数据分析SQL面试_高频73题(实时更新建议收藏)

    数据分析岗位面试的过程中常考的高频73题刷题笔记,不足之处望多多指正. 前言 无论是在数据分析师面试还是数据挖掘等的多数大数据岗位的面试.工作过程中,SQL都是比较重要的一部分,本文主要是笔者刷牛客的 ...

最新文章

  1. Netty学习笔记(二) 实现服务端和客户端
  2. 人,最终可能还是平静的干事情,这是最终的奥义
  3. axios 最全 请求拦截器 响应拦截器 配置公共请求头 超时时间 以及get delete post put 四种请求传参方式
  4. red hat安装宝塔_如何在几分钟内安装Red Hat Container Development Kit(CDK)
  5. 技术人解读企业为什么要平台化,关于数据中台你不知道的事...
  6. 【C/C++】深入理解原子操作 volatile i为什么不能保证i++的原子性
  7. leetcode力扣46. 全排列
  8. [xdoj1029]求解某个数的最高位和最低位
  9. 55. mysqli 扩展库(2)
  10. c++ inline 函数及变量
  11. 在linux下搭建tftp服务器,嵌入式linux常用服务配置之tftp服务器配置
  12. axure如何导出原件_彻底抛弃WORD!教你用Axure快速输出高质量的PRD
  13. 【托业】【新托业TOEIC新题型真题】学习笔记13-题库四-P7
  14. 考研复试问题集锦——数据库
  15. SpringBoot基础学习之整合Swagger框架(下篇)
  16. android emulator 安装 google play
  17. ActiveMQ 无法访问管理页面
  18. 网站服务器怎么做防御?遇到攻击如何解决?
  19. 查询网卡MAC地址.bat
  20. Maven使用(1)

热门文章

  1. 软件工程网络15结对编程作业(201521123062)
  2. 渗透学习日记day5
  3. python获取cpu温度_Python如何读取CPU和GPU的温度?
  4. 两个计算机系统安装,如何一个电脑装两个系统|一个电脑装2个系统方法
  5. v4l2接口解析和摄像头数据采集
  6. 基于端口号的虚拟主机配置
  7. ssh-keygen处理gitee
  8. 关于5G的理解:5G的发展历程、5G原理
  9. C++ 实现哈夫曼树和哈夫曼编码
  10. 联想微型计算机重装,联想一体机电脑重装系统教程 一体机电脑重装系统