SQL查询:JOIN ON、DISTINCT、GROUP BY、ORDER BY等等。从数据库中提取数据是数据分析的第一步。另外我们的数据规模是TB级的,所以还要能使用SQL让集群做一些简单的计算,不然都下载到本地的话运算资源是肯定不够的。可能还会问一些非常基础的问题,比如PRIMARY KEY、int、str、double之类。Excel:数据透视表、VLOOKUP、COUNTIFS、SUMIFS、VAR.P、条件格式等等,可能会涉及到诸如VLOOKUP中的TRUE和FALSE参数有什么区别,VAR.P和VAR.S有什么区别等细节问题。
1.2 自选动作
根据简历来问,简历上写什么就问什么,会问得比较深入。简历作为敲门砖,撰写也是非常重要的,切不可写的过于夸张和造假,奉劝各位不要作死,毕竟不作死都有可能会死。Python、Stata、R、SPSS、SAS、EViews都算比较常见的数据分析工具。比如简历上写“精通Python”,虽然hr知道简历注水是常态,但既然都“精通”了,那问到pandas,regular expression,DataFrame.iterrows()返回的是Series还是dictionary还是list of tuples,tuple和list的区别的时候好歹都得答出来吧……
2
2.逻辑思维
主要分为两方面,对业务逻辑的理解能力和行文的逻辑水平。
2.1业务逻辑
虽然一个业务看似流程简单清晰,但产生数据的复杂程度往往超过大多数人的想象。对业务逻辑的考察主要通过相关项目经历。这里小编告诫大家一句,写在简历上的项目经历起码自己要非常熟悉,对答如流。以我家hr为例,每天接触的是700多张表,每张表的字段往往超过200个。这些表和字段往往还有关联。面对这么多业务指标,能否迅速理解它们之间的联系? 面对新的数据需求,能否逻辑清晰地将它拆分成指标、二级指标并进行各种计算? 面对复杂的局部最优化和全局最优化需求,能否“抓大放小”,能否迅速找到关键控制点、关键影响因素并加以优化?思维不敏捷,逻辑不清晰的话,是很难做好这份工作的。
2.2行文逻辑
毕竟最终产出是一份份报告,可能是HTML邮件也能是PDF。文章结构还是很重要的。这里不展开说了,不过关键的几点是先说结论,先写摘要。
3
3.理论储备
也分为规定动作和可选动作。
3.1 规定动作
主要是基础的统计学理论,如方差、协方差、算数平均数、几何平均数、中位数、众数、分位值、双峰数据、长尾数据、假设检验、期望迭代法则、贝叶斯原理等。
3.2 自选动作
根据简历来问,简历上写什么hr一定会问什么。第三次奉劝各位不要作死,写的检验也好机器学习算法也好好歹自己要知道原理、适用条件、局限性。不然跟你聊起Pearson distance、K-means cluster的随机性问题的时候你接不上来也是很尴尬的。
4
4.对细节的敏感度
作为数据分析师,每天要关注大量数据指标。对细节的敏感度是非常必要的。这主要分为两方面,对统计口径的敏感度和对数据的敏感度。
4.1 统计口径
统计口径一致是确保数据可比性的基础,这非常考验数据分析师的敏感度和行业经验。比如转化率,是点击算转化还是注册算转化还是购买算转化?配送时间,是从用户下单开始计时还是从订单确认开始计时还是从商品出库开始计时?客单价包不包括配送费、打包费、代金券形式的折扣优惠?
4.2 数据
面试者对数据异常波动、离群值、平均数没有代表意义等情况的迅速识别能力。比如已知然寿司套餐单价1,500,酒水单价300,平均客单价2,500,能不能马上想到这可能是双峰数据或者长尾数据,抑或既双峰又长尾的数据?
5
5.学习能力
互联网行业瞬息万变,光数据的存储就有Oracle、MySQL、Hadoop、Spark、Hive、Impala、谷哥哥三驾马车等一大堆奇奇怪怪的东西。互联网行业的从业者经常要面对新需求、新工具、新方法。能否迅速掌握新知识,解决新问题面试者必须证明给hr看。主要考察的方式是了解过往项目经历,或者出作业题(比如Sci-Hub)。
6
6.排版和简单UI设计
数据分析报告必须简洁、清晰、重点突出。主要考察方式是出作业题让面试者限时交一份slides(就是PPT啦)出来。能掌握标准的Microsoft Design Language是大大的加分项。
7
7.价值观
主要看工作热情、态度、道德水平等等,这方面的问题比较随机。

大数据分析师面试要注意的7点相关推荐

  1. 大数据分析师面试求职攻略

    面试大数据分析前焦虑怎么办? 如果你没有得到面试怎么办? 大数据分析师面试过程尴尬怎么办? 如何准备大数据分析师面试? 大数据分析师的面试技巧有哪些? 大数据分析师的面试注意事项有哪些? 如何在大数据 ...

  2. Interview:人工智能大数据岗位面试—【数据分析师】的简介、技能、待遇、进阶的详细攻略

    Interview:人工智能&大数据岗位面试-[数据分析师]的简介.技能.待遇.进阶的详细攻略 目录 数据分析师的简介 1.网友经验之谈 数据分析师的待遇 数据分析师的技能 数据分析师进阶 数 ...

  3. 资深讲师分享大数据分析师职业规划

    最近有不少同学向咨询有关大数据分析职业发展的问题,由此可见,随着大数据分析的飞速发展,大数据分析职业也成为很多同学关注的目标.不要急,这就给大家介绍大数据分析的职业发展. 一.为什么要做大数据分析师 ...

  4. SparkSQL和Hadoop(面向数据科学家和大数据分析师)

    了解HDFS命令.Hadoop.Spark SQL.SQL查询.ETL和数据分析| Spark Hadoop集群虚拟机|完全解决的问题 你会学到什么 作为本课程的一部分,学生将获得在Spark Had ...

  5. 什么是大数据口子_大数据分析师年薪几十万,学什么专业才能从事大数据?

    近几年,大数据为各个领域带来了全新的变革,大数据的重要性越来越被企业和国家所看到,大数据工作者的需求再次被无限放大,他们的薪资和社会地位也在不断上涨.马云在演讲中就提到,未来的时代将不是IT时代,而是 ...

  6. 怎么才能转入大数据领域 ,成为一名合格的大数据分析师...

    2019年的高考很快就要拉开序幕了.而考生和家长除了要面临考试这一难关外,考试之后填报志愿时,选择大学和专业也是一个难题. 最近两年很多高校都开设了互联网相关专业,大数据.机器人等专业成为热点.在20 ...

  7. 大数据项目一般金额多少_大数据分析师年薪一般多少?学什么专业才能从事大数据?...

    近几年,大数据为各个领域带来了全新的变革,大数据的重要性越来越被企业和国家所看到,大数据工作者的需求再次被无限放大,他们的薪资和社会地位也在不断上涨.马云在演讲中就提到,未来的时代将不是IT时代,而是 ...

  8. 做好领导最喜欢的可视化报表,30岁依然能转行大数据分析师

    我今年30岁了,已经工作了快8年,上有老下有小,但是我看不到自己工作的未来,想辞职又不敢,这种情况下可以转行吗? 一般情况下,我不告诉当事人晚或者不晚这个非黑即白的答案.因为懂的人都知道,这个得分情况 ...

  9. 数据说大数据分析师吴女士观点:大数据是回暖的计算机行业中绩增速最高的子行业...

    [背景] 近日,工信部正在制定<大数据产业"十三五"发展规划>,支持大数据技术和产业创新发展,提升大产业支撑能力,培育新业态新模式.在细分领域,大数据的政策推动力度明显 ...

最新文章

  1. golang 函数结束后 goroutine退出机制
  2. [2020.11.25NOIP模拟赛]下棋【dp】
  3. 管理口地址 ibm_WAN口有IP地址上不了网如何解决 WAN口有IP地址上不了网解决方法【详解】...
  4. 前端如何设置背景颜色的透明度 css中的 rgba() 函数详解 :background-color: rgba(255,192,203,0.3)
  5. Linux环境下使用NLPIR(ICTCLAS)中文分词详解
  6. 编程语言c 是什么意思,C/C++知识点之C语言中%*s,%*c 是什么意思
  7. Vue.2.0.5-Class 与 Style 绑定
  8. 安全测试 - XSS如何防御
  9. B-S期权定价模型 Black Scholdz
  10. 功能强大的云打印组件-接口文档
  11. 如何看待B站疑似源码泄漏的问题?
  12. MT6763,MT6763T(P23),MT6750T,MT6755(P10)参数比较
  13. Redis6.0.6_06_Redis 集群
  14. 如何退出或卸载奇安信天擎软件
  15. 逻辑思维、时间管理、学习记忆书单整理
  16. 中链云 | IPFS入门知识(五)
  17. 前端本地静态模板下载功能
  18. 响应式网站设计(1)-理论
  19. JS获取当前设备 查看当前系统 最全代码
  20. 2014校园招聘_百度2014校园招聘

热门文章

  1. 前端新手入门-有了这两个软件小工具学习事半功倍
  2. android禁用光感按键
  3. 分箱_best-ks分箱
  4. 今天一整天,腰酸腿疼。
  5. matlab trapz求二重积分,matlab求积分(超详细,含int integral integral2/3 quad trapz
  6. uniapp项目rpx和px单位转换,满足适配需求
  7. 超好用的检测模块---SUI-101A交流变送器
  8. Subversion常见问题及解决方法
  9. jquery中的for循环与each循环
  10. 拖拉机java_拖拉机(升级)必胜之秘诀 - 淡泊明志,宁静致远 - JavaEye技术网站...