数据丢失与重复_大数据面试题分享-恭喜这位朋友刚毕业拿到了20K
找工作的同学有福气啦!真实大数据面试经验分享系列文章逐步上线,欢迎持续关注!
某网
一位朋友的面经,恭喜他拿到了高薪的 offer。
1、介绍项目
2、redis用过吗
谈谈redis吧
键值分别是什么,用的什么数据结构
谈谈redis的三种模式,你们用的什么模式
3、kafka
kafka+sparkstream的两种模式,有什么区别
direct模式如果偏移量是自己维护吗,如果来了一批数据还没有消费完,下一批就来了,如何保证每消费完的那一部分数据不会丢失
你们kafka里面一个topic下面设置了多少个patition,每个patition多少副本
假如让你设计一个线程安全的kafka消费模型,怎么设置,可以把它放在什么数据结构中
4、hbase
你们region一般设置多少个
假如我要scan一张表,在hbase里面的流程是什么样的(要注意把region的寻址也说出)
hbase你们一般读操作多还是写操作多还是混合操作
5、hive
hive分层
6、spark
spark优化
spark shuffle的种类,分别有什么区别
spark MLlib用过什么库
spark里面的数据模型
spark中job是怎么回事,是怎么划分的
spark任务的执行流程
7、storm与sparkstream对比
8、es了解吗,它比solr好在哪里,底层是什么
9、JVM了解多少
spark统一内存管理中,存储内存和执行内存占的比例,执行内存占用资源后,存储内存还可以拿回去吗
10、java:
spring的aop、ioc
springmvc处理一个请求的流程是什么样的
springmvc用了什么设计模式
arrayList底层是什么?与linkList对比
线程池用的多吗?怎么得到一个带返回值的线程
--------------------------------------------
11、hashmap的原理又被问到了,怎么防止hashmap的碰撞问题
12、写个冒泡排序?快排是什么样的
13、说说spark的RDD
14、hdfs有什么结构
15、hive的优化
16、hbase的rowkey设计
17、kafka的数据丢失和重复消费问题
18、jvm中新生代跟老年代的比例
19、线程有什么状态
20、flume有没有碰到过收集到重复数据的问题,怎么解决呢
21、sqoop从两台不同的服务器拉数据的时候,万一服务器时间不同步会有什么情况
22、dubbo是干什么用的,怎么用
数据丢失与重复_大数据面试题分享-恭喜这位朋友刚毕业拿到了20K相关推荐
- hive hql文档_大数据学习路线分享hive的运行方式
大数据学习路线分享hive的运行方式,hive的属性设置: 1.在cli端设置 (只针对当前的session) 3.在java代码中设置 (当前连接) 2.在配置文件中设置 (所有session有效) ...
- flink source 同步_大数据面试题-Flink
1.Flink 的 抽象层次有几种 Stateful stream processing Core API Table SQL 2.Window 类型 (1)TimeWindow Tumbling W ...
- 大数据面试题Spark篇(1)
目录 1.spark数据倾斜 2.Spark为什么比mapreduce快? 3.hadoop和spark使用场景? 4.spark宕机怎么迅速恢复? 5. RDD持久化原理? 6.checkpoint ...
- 大数据面试题及答案 100道 (2021最新版)
大数据面试题及答案[最新版]大数据高级面试题大全(2021版),发现网上很多大数据面试题都没有答案,所以花了很长时间搜集,本套大数据面试题大全 最近由于要准备面试就开始提早看些面试.笔试题.以下是自己 ...
- 大数据面试题及答案 汇总版
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/albg_boy/article/det ...
- 你不知道的BAT大数据面试题
你不知道的BAT大数据面试题 1.kafka的message包括哪些信息 一个Kafka的Message由一个固定长度的header和一个变长的消息体body组成 header部分由一个字 ...
- 大数据知识面试题-Flink(2022版)
序列号 内容 链接 1 大数据知识面试题-通用(2022版) https://blog.csdn.net/qq_43061290/article/details/124819089 2 大数据知识面试 ...
- 5W字讲解最新大数据面试题
此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待 复习大数据面试题,看这一套就够了! 本文目录: 一.Hadoop 二.Hive ...
- (转)大数据面试题130道及答案整理 1-15
大数据面试题130道及答案整理 1-15 转载自:https://www.cnblogs.com/yuluoxingkong/p/13475235.html 1.HashMap 和 Hashtable ...
最新文章
- android 平板安装程序开发者,android – 限制平板电脑中的应用安装
- 网站不经意间过度优化了怎么办?有什么解决方案?
- IDEA启动项目:找不到或无法加载主类
- CodeForces - 1526D Kill Anton(模拟)
- input ios问题 小程序_微信小程序开发常见问题汇总
- 产品经理如果有捷径,那可能是多读书
- 【算法分析与设计】寻找假币问题
- 模型计算机控制器的设计,模型计算机控制器的设计.pdf
- XenDesktop 5之痛---Database Transaction Log速增
- OpenCV学习(13) 细化算法(1)(转)
- 零起点英语_【德国零起点】05—变元音字母
- 初了解JS设计模式,学习笔记
- html怎样在标签中显示图片,HTML-图片标签学习
- 沙盒生存游戏:打造世界Craft the World Mac中文版
- 9款超级好用的在线PDF工具!
- Rust语言教程(2) - 从熟悉的部分开始
- sudo: no valid sudoers sources found, quitting
- 如何成为“头脑王者”?每天5分钟,让你的大脑准备就绪!
- APP第一次请求HTTPS慢
- 【lnmp+ELK+Nginx+GeoIP】超详细新版ELK8.5.0解析收集Nginx日志并实现数据可视化与IP地址地图可视化教程-2022年11月版