数据分析知识体系与校招时间线
一、数据分析知识体系整理
1、统计学(数据分析核心理论基础之一)
具体知识点:
- 统计学两大基础定理:大数定理,中心极限定理
- 常见分布的图像,性质与应用(ex. 正态分布,泊松分布…)
- 假设检验 & AB测试全流程(统计学在数据分析领域中的重中之重!!)
- 条件概率 & 贝叶斯公式
- 排列组合(虽然是高中知识但是大厂笔试特别喜欢考这个)
- 常用统计软件的使用(ex. SAS, SPASS etc.)
推荐学习资料:
- 浙大版《概率论与数理统计》
2、SQL(结构化查询语言)
数据分析最重要的工具之一(也许没有之一),以致于很多基层数据分析师被称为SQLBOY & SQLGIRL。
具体知识点:
- SQL基本语法与执行顺序
- 窗口函数
- SQL常用技巧(如自连接,子查询等)
零基础入门 - 《SQL必知必会》(SQL金牌工具书)
- Datacamp SQL教程(从零开始手把手教+练)
有了一定基础后就是刷题啦
- Leetcode
- 牛客网SQL专项
注:刷题的难度与数量可以根据个人需求自行调整,如果想要获得"一定的数据分析能力"的话,刷完简单和中等,能独立在数据库完成基本的"增删改查"操作就已经是一项非常加分的技能了。但对于专职数据分析师来说,光会是不够的,必须要做到非常熟练
3、Excel
Excel作为一个老牌数据分析工具,因为比较容易上手经常处于数据分析工具鄙视链的底端,但是一个工具好上手不代表上限低,也不代表功能性逊于那些复杂的工具,在对少量数据做简易处理时,Excel依旧是首选。
具体知识点:
- 各种常用函数(VLOOKUP,SUMIF等)与快捷键
- 数据透视表
- 数据可视化(各种图)
推荐资料
- 《Excel图表之道》
4、Tabelau & Power BI
众所周知,Excel画图虽然方便,但是丑,而且不太好画复杂的图,Tabelau,Power BI这种专业的数据可视化软件完美的填补了这个缺陷,助你画出高逼格的图。资料直接看软件官方教程就可以~
5、业务
数据分析要面对的从来都不止是数据,单纯的SQLBOY &
SQLGIRL是很容易被取代的,所以培养业务思维是一个合格数据分析师的必修课,毕竟只有符合业务实际的数据分析才是有意义的数据分析。当然啦,一般公司不会苛求还在读书的学生在面试的那几分钟内想出完全切实可行的方案,但是校招生需要向面试官展示自己清晰的逻辑来证明自己是一块"可塑之才"。
以下列举一些互联网领域常见的业务题:
- 日活突然下降了10%,应该怎么分析?
- 请针对某款产品/业务,搭建相应的指标体系
推荐资料
- 网站"人人都是产品经理"
接下来是一些进阶能力,一般是只有专职数据分析师才需要点的技能树(非专职数据分析师的朋友也可以加以了解,数据分析领域实在是太广了,不同方向的数据分析侧重点也不同,会的东西当然是越多越好啦)
6、数据预处理
“数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”。这里的数据,并不是指原始数据,而是经过预处理的数据。数据预处理包括数据清洗,特征工程等多个过程,可以作为数据挖掘&机器学习之前的准备,亦可以用在普通的数据分析工作中,可以说对数据分析师来说非常的重要,也是各大厂面试的高频考点。
具体知识点:
- 空值与异常值的处理
- 数据标准化&归一化
- 数据规约
- 标签编码&独热编码
推荐资料:由于这块知识比较零散,不是很好找单独的资料,强烈建议想要学习的朋友去打一场kaggle or 阿里天池的竞赛,可以很好的熟悉整个数据预处理的流程。
7. 数据挖掘 & 机器学习
近些年大热的领域,虽然大公司里一般都会有专门的算法工程师&机器学习工程师,但是数据分析师掌握一些基础的机器学习知识依旧会对工作有非常大的帮助,美团面试时面试官就特意和我强调他们喜欢懂机器学习知识的应聘者。
具体知识点:
(注1:数据挖掘 & 机器学习知识应用非常广,以下只是在数据分析领域应用的高频知识点; 注2:本条技能的知识点为由易到难排序;注3:即使是第一条知识点也不简单)
- bias-variance trade off与交叉检验
- 常用的模型评估方法(R^2, RMSE, AUC etc.)
- 常见的回归,分类,聚类算法的假设,基本原理,参数,优缺点与使用场景(常见模型有:线性回归,逻辑回归,岭回归,LASSO,决策树,SVM,XGBoost,随机森林,k-means etc.)
- 模型调参
- 神经网络
- 手推算法
推荐学习资料:
- 宝藏Youtuber “StatQuest”(力荐,把每个机器学习算法原理拆解的非常清楚易懂)
- Kaggle,阿里天池等的竞赛同样对这块知识很有帮助
8、Python & R
之前提过,做简易,少量的数据处理Excel是一个很好的选择,但是Excel的局限性也非常明显,在面对大量数据复杂处理时(比如上面提到的6和7),Excel就有点捉鸡了,而Python& R确是个中好手,这也是大数据时代Python & R大火的原因之一。
具体知识点:
- 数据分析的常用库(Numpy,Pandas, Scikit-Learn etc.)
- 正则表达式与爬虫
- 基础数据结构与算法
推荐资料:
- 莫烦Python
- Leetcode & 牛客网基础算法题
9. 大数据架构
大数据时代数据分析师也得学会如何与超出普通电脑储存极限的海量数据打交道。
具体知识点:
- Hive & Hadoop核心架构与基本原理(HDFS, MapReduce etc.)
- 数据倾斜原理及解决方案
- Spark与Hadoop的对比
推荐资料:
- 尚硅谷Hive&Hadoop&Spark(b站就有,全免费)
二、校招准备时间线
校招前N月
充实简历内容。不可否认写简历是有很多技巧的,但是巧妇难为无米之炊,没有一点实打实的东西的花架子是逃不过招聘官千锤百炼的双眼的。
充实简历内容包括有:
- 强化量化成绩
对绝大多数公司来说,就是GPA(绩点) - 增加相关项目与实习经历
对于绝大多数岗位来说,实习和项目经历都是面试的时候面试官最喜欢问的部分。丰富的实习与项目经验可以让你的简历丰满很多,实习与项目中积攒的经验也能帮助你在面试流程中游刃有余。需要注意的是,在实习与做项目的时候,尤其是你打算写进简历里的那些,千万不要摸鱼,因为面试官不会放过实习&项目中的任何一个细节。
校招前三个月
- 选定目标岗位 & 针对性查漏补缺与刷题
首先说明一下,目标岗位≠职业大方向,职业大方向一定是越早确定越好的,目标岗位相对职业大方向是一个更细化的过程。比如我的职业大方向是做数据,但是数据类岗位下面会有数据科学家,数据分析师,数据工程师,数据运营,数字化产品经理…
每一个细化的岗位要求的技能树都是不一样的,并且学校学习的知识也很难完美贴合其中任何一个岗位(大多数情况是都沾点边),所以选定了目标岗位后,就需要针对性的查漏补缺和刷题啦。这里补充一点,除了各自岗位的专业知识外,各大公司还喜欢在笔试环节增加行测题(非技术岗尤其),行测题又以北森的题库最为常见,所以强烈建议大家在秋招前,刷一刷北森的行测题库(淘宝有卖)。
校招前一个月:准备简历
对于大部分岗位来说,简历的模板其实都是差不多的,一份优秀的简历应该包括学校经历(GPA&相关课程)+获奖经历(没有高含金量的可以不写)+实习经历+竞赛&项目经历+技能树,一般都需要在一页纸之内。
以下列举一些本人的小建议:
- 简历务必精简,又臭又长是大忌
- 推荐模板:百度或者微信公众号搜"超级简历"
- 实习经历与竞赛 & 项目经历是面试官最看重的部分,请务必给足空间(个人建议至少占一半的空间)
- 简历务必贴合目标岗位的职位要求,无关的自我介绍和个人爱好是纯粹的浪费空间
- 即使是同一个岗位,不同公司具体要求也会有区别,建议在投递每个公司前都对简历进行审核与修改,这样可以大大增加过审的概率。
校招开始后需要做的有
- 收集招聘信息,以下列举一些常用途径(公司官网、求职公众号、求职网站)
- 找内推 & 刷面经(这两步强烈安利牛客网(尤其是互联网领域),真的很好用。)
- 归纳整理&查漏补缺(每次笔试&面试都是一次练兵,勤归纳才能越战越勇。)
校招开始的时间点
- 秋招:提前批6月开始,正式批8月开始,一般来说越大的厂开的越早
- 春招:提前批年前开始,正式批年后开始,同样的,一般越大的厂开的越早
备注
本文转载自牛客网:
作者:杭州的风
链接:https://www.nowcoder.com/discuss/605569?type=2&order=0&pos=37&page=1&source_id=discuss_tag_nctrack&channel=-1
数据分析知识体系与校招时间线相关推荐
- 2021 计算机 保研经历 保研经验贴 保研知识扫盲 保研时间线(合肥工业大学 软件工程 rk4/165,211 3%)
前言 保研常识扫盲 最近很多学弟学妹问我一些相关问题,在这里做一个基础总结 保研是指推免研究生,即不需要通过国家统一的研究生考试,直接获得一个免试推荐的资格. 每个学校都有一定的保研名额,你拿到保研名 ...
- 张俊红数据分析知识体系(持续更新中......)
本文从用户思维.数据分析思维.数据分析技能.学习能力四个方面进行自我总结. 01 | 用户思维 数据分析终究是围绕用户的一系列行为进行展开的,所以做数据分析第一门需要掌握的知识是懂用户. 首先得知 ...
- 数据分析 知识体系 Python篇
numpy 基本属性 n维数组:数值运算 创建数组: np.array(list,dtype=) 数组维度:array.ndim 数组形状:array.shape 数组元素个数:array.size ...
- python数据分析知识体系_数据分析知识体系
[数据获取] 一.获取原始数据 1.从数据库 / 数据仓库中获取(数据库 + 数据仓库 + SQL提数) 2.爬虫爬取(R语言爬虫 + Python爬虫) 3.手工整理(问卷数据录入.数据表制作等) ...
- 包邮再送500份!我们自制了一张【数据分析知识鼠标垫】,抓紧领取
之前,我们自制了一款<数据分析全栈知识鼠标垫>,做了500张送给粉丝,很快就抢没了,获得了不错的反馈,来看看大家的晒图: 感谢粉丝们的口口相传,这张鼠标垫现在也算小有名气了,现在还经常有读 ...
- 数据分析常用知识体系
数据分析常用知识体系 [数据获取] 一.获取原始数据 1.从数据库 / 数据仓库中获取(数据库 + 数据仓库 + SQL提数) 2.爬虫爬取(R语言爬虫 + Python爬虫) 3.手工整理(问卷数据 ...
- 历时8个月,10w字!前端知识体系+大厂面试笔记(工程化篇)
前言 本文是10w字 前端知识体系+大厂面试总结 的 第三篇 其余3篇为基础知识篇.算法篇.前端框架和浏览器原理篇,如果还没有阅读,建议了解下 工程化目的是为了提升团队的开发效率.提高项目的质量 例如 ...
- DAMA数据管理知识体系指南之数据管理和数据治理
全网最全大数据面试提升手册! 简介:DAMA:国际数据管理协会,是一个全球性数据管理和业务专业志愿人士组成的非营利协会,是当前国际上在数据治理领域最权威的机构.DMBOK2则是DAMA组织众多数据管理 ...
- 大佬教你Android如何实现时间线效果
背景 这天下班前,老板找到小庄:有个页面要优化,小需求,你跟进一下. 小庄:好的老板! 他看了看时间,忐忑地翻出原型,看到了这样一个页面: 思索片刻后,小庄熟练地打开了某搜索引擎,没有找到合适的轮子, ...
最新文章
- Hybrid de novo tandem repeat detection using short and long reads 使用短读和长读的混合从头到尾串联重复检测
- eSpeak: Linux 文本转语音工具
- css:中文词不断开,整体换行
- vue中Axios的封装与API接口的管理详解
- printf与sprintf
- Spring MVC Rest 学习 一
- 新疆计算机一级考试试题手机软件,新疆维吾尔自治区计算机一级考试理论题库(最新最完整)...
- 【youcans 的 OpenCV 例程200篇】117. 形态学操作之顶帽运算
- JEECG_3.7 权限开发讲解-张代浩-专题视频课程
- 容器中Bean的生命周期
- 小程序商店刷榜_微信小程序店铺如何做引流,带来转化?
- yarn启动vue项目
- LQR:Linear Quadratic Regulator 线性二次型调节器
- DFMEA之严重度/频度/探测度/风险优先系数
- 武汉军工保密资格认定的基本流程和要求
- Win11便笺不工作怎么办?Win11便笺停止工作解决办法
- 快速实现内网穿透已成功(巧妙绕过路由器)
- 多卡聚合技术在应急可视化指挥调度的应用
- java毕业设计智慧公寓系统演示录屏2021Mybatis+系统+数据库+调试部署
- Twitter实现每秒处理3000张(20G)图片的优化实践