同事们,打球来讲的话激烈但水平一般,下次从投篮方面碾压,并且不要选择毒瘤队友

1.深入了解数仓开发

技术要求:

1、编程语言

由于很多大数据组件都是由Java编写,所以Java是必须要学会的,而且要较为深入。这里的深入并不是只工程能力,而是要把Java SE学明白,这里就有很多八股需要背。sql也需要非常熟练,不过这部分基本都是使用,八股不多。Scala和Python我觉得是锦上添花,可学可不学。

八股例:

Java的GC有哪些,有什么特点?

Java多线程和线程池?

hashmap的底层实现?

列表扩容机制?

sql执行流程?

2、算法能力

这个没得说,最简单的办法就是刷lc或牛客,至少要刷完面试高频的题,很多面试都有手撕算法,在会写的同时也要有一定的理解,不熟练的话面试紧张很容易写不出来。在数仓方向与后端不同,也需要对sql熟练,面试基本上都会手撕sql,个人理解sql比算法要简单不少,但也需要一定的积累。偶尔也会遇到一点非算法的手撕,比如写个饿汉单例,或写个分词计数(MapReduce或Spark)。

3、大数据组件

hadoop系列要背一些面经的,hdfs、MapReduce、yarn、hive、zookeeper等,这里有不少面经需要背,也是最能体现你熟悉大数据领域的地方。其次离线数仓要学好spark,实时数仓要学spark stream和flink。其他的像MySQL(很重要)、redis、Kafka(mq)、clickhouse等等也是体现你能力的地方,体现你的专业。

八股例:

mr中shuffle的具体流程?三次排序?分别是什么排序?

spark的宽窄依赖?如何划分stage?比mr优势在哪?

hdfs的容灾策略?读写流程?fsimage和editlog?

MySQL版本链?为什么使用B+树?

数据倾斜?怎么解决?怎么设计表

redis雪崩?

4、数仓模型

这是一个非常重要的部分,以至于我单独拿出来。因为这是考察面试者到底懂不懂数仓最直接的问题。至少学好阿里的one data数仓模型,至少要懂每层是在干什么,为什么要这么设计。

八股例:

讲一下数仓模型?为什么这么分层?

维度是什么?维度建模是什么?

数仓建模的流程步骤?

给你一个场景,你会怎么设计?

星型、雪花、星座模型?

5、相关项目

需要做至少一个数仓的项目,b站上很多,找一个至少看明白,写在简历上(面试官问一些刁钻问题的时候能清晰回答不露馅)。项目是必须要有的,即使你的项目在面试官看来像个玩具,但如果连相关项目都没有,面试官也没有办法(许多公司面试时都明确要求要问项目)。

6、计算机基础

很多同学注重语言和大数据组件的学习,忘记了计网、操作系统等这些才是学生最该熟练掌握的,这是体现个人知识扎实程度的部分,非常关键。这里也会有一些八股需要背,对于科班同学来说,学好课上的知识就基本OK,但对非科班的同学来说就稍微麻烦一些,需要花些时间。

八股例:

TCP与udp?三招四挥?http与https?

七层模型?

页?线程与进程?

7、面试技巧

注意不要问不该问的,一定不要过于谦卑,要自信但不要自傲。如果你能跟面试官聊一些他都感兴趣的东西,那就基本上成功了!

总结

如果上面的一些八股你都差不多能答上来,那很有机会找个不错的实习,我找实习的时候也就差不多这样(不过今年不知道会不会更卷,不敢打包票)

如果是实习,可以根据情况少学一些,但也要至少对Java,mr,hdfs等有较为深刻的认识,算法sql也要过关

Trip.com W1D5相关推荐

  1. POJ-1041 John's trip

    写的时候思路很混乱,反复调试交了一发过了,后来才想清楚为啥 首先直接根据街道的值来排序从小到大排序,然后dfs一下就能得到答案,但是问题在于自己对于跑dfs理解不深出现了问题, 1.从小到大排序 2. ...

  2. Codeforces 766E Mahmoud and a xor trip(树形DP)

    题目链接 Mahmoud and a xor trip 树形DP.先考虑每个点到他本身的距离和,再算所有点两两距离和. 做的时候考虑二进制拆位即可. #include <bits/stdc++. ...

  3. Codeforces Round #396 (Div. 2) E. Mahmoud and a xor trip 二进制拆位+树型dp

    E. Mahmoud and a xor trip 链接: http://codeforces.com/contest/766/problem/E 题意: 给定一颗n节点的树以及每个节点的权值,另di ...

  4. I - Ant Trip (无向图欧拉回路+并查集),判断

    I - Ant Trip 参考博客:Ant Trip(欧拉回路+并查集) 参考:欧拉路径问题与欧拉回路问题 题意:给你无向图的 N 个点和 M 条边,保证这 M 条边都不同且不会存在同一点的自环边,现 ...

  5. POJ 1041 John's trip(欧拉回路)

    本文链接:http://www.cnblogs.com/Ash-ly/p/5398549.html 题意: Johnny 有了一台新车,他想去访问他所有的朋友(赤裸裸的炫耀?),他的朋友有很多,住在城 ...

  6. POJ - 1041 John's trip(欧拉回路)

    题目链接:点击查看 题目大意:给出一张无向图,要求从起点开始遍历一遍所有的边,最后再回到起点,题目要求输出任意一组方案 细节: 起点不是点1,而是第一条边中两个端点中娇小的一个点 给出的x y z代表 ...

  7. 单调栈思维 2021年度训练联盟热身训练赛第三场——K题 Summer Trip

    题意: 给你一个字符串,问其子串中有多少个满足: 1.子串头尾字母不相同: 2.子串内部字母与头尾字母不相同: 3.子串长度大于等于2: 问有多少个这样的字串? 题目: Leo has started ...

  8. AtCoder Regular Contest 061 E - Snuke‘s Subway Trip(建图 + dijkstra最短路 / 0/1bfs / 并查集)

    AtCoder Regular Contest 061 E - Snuke's Subway Trip problem 洛谷翻译 my idea 最近一直在做网络流,所以一读这题后,我就想到了最小费用 ...

  9. John's trip(POJ1041+欧拉回路+打印路径)

    题目链接:http://poj.org/problem?id=1041 题目: 题意:给你n条街道,m个路口,每次输入以0 0结束,给你的u v t分别表示路口u和v由t这条街道连接,要输出从起点出发 ...

最新文章

  1. java实现简单链表
  2. 由于未分配内存的指针导致段错误
  3. SmartSVN for Mac 使用说明
  4. java font属性,css font-family属性怎么用
  5. 第七章:集成学习(利用AdaBoost元算法...)
  6. deepin安装bochs2.6.2_深度Deepin系统中wine4.0.1源编辑安装
  7. 数据科学入门与实战:玩转pandas之五
  8. 微助教课件怎么下载_【微助教课件下载】[微助教]自测一下,您的课堂有好的开始和结束么?...
  9. 分布式系统研发初体验
  10. Spring框架IOC容器,依赖注入,控制反转
  11. 计算所与北大往事回顾
  12. 微信公众号H5网页调用微信支付
  13. Linux字符设备驱动之LED驱动
  14. Git Commit 规范以及emoji 使用指南
  15. CRC32 Hash PK Murmur Hash
  16. jumpserver
  17. 工程技术专业技术职务共分为13个等级
  18. 解析Activity的启动过程
  19. java中jsp内建对象有_JSP内置对象有哪些
  20. “我们必须知道,我们终将知道”

热门文章

  1. 计算机网络职称考试试题,职称考试Internet题库9-职称计算机考试网络应用试卷与试题.pdf...
  2. 流浪猫狗救助平台(基于SSM的毕业设计)
  3. latex 分行 表格标题过长_使用latex软件,其页眉显示标题内容,由于标题太长,不能一行显示,如何使页眉显示多行,谢谢...
  4. 区块链赋能人工智能,和数软件为何能实现突破?
  5. 华为云计算机玩游戏,华为云电脑玩游戏怎么样?华为云电脑玩游戏卡吗?
  6. 【2021 arXiv机器学习论文精选】
  7. ubuntu下Chrome安装支付宝控件
  8. python与7无关的数输出格式第一行为所有与7无关的数_十三道Python练习题
  9. 秒杀理解Kafka原理
  10. 电脑玩游戏花屏怎么办,显卡花屏解决方法