找工作的同学有福气啦!真实大数据面试经验分享系列文章逐步上线,欢迎持续关注!

某网

一位朋友的面经,恭喜他拿到了高薪的 offer。

1、介绍项目

2、redis用过吗

谈谈redis吧

键值分别是什么,用的什么数据结构

谈谈redis的三种模式,你们用的什么模式

3、kafka

kafka+sparkstream的两种模式,有什么区别

direct模式如果偏移量是自己维护吗,如果来了一批数据还没有消费完,下一批就来了,如何保证每消费完的那一部分数据不会丢失

你们kafka里面一个topic下面设置了多少个patition,每个patition多少副本

假如让你设计一个线程安全的kafka消费模型,怎么设置,可以把它放在什么数据结构中

4、hbase

你们region一般设置多少个

假如我要scan一张表,在hbase里面的流程是什么样的(要注意把region的寻址也说出)

hbase你们一般读操作多还是写操作多还是混合操作

5、hive

hive分层

6、spark

spark优化

spark shuffle的种类,分别有什么区别

spark MLlib用过什么库

spark里面的数据模型

spark中job是怎么回事,是怎么划分的

spark任务的执行流程

7、storm与sparkstream对比

8、es了解吗,它比solr好在哪里,底层是什么

9、JVM了解多少

spark统一内存管理中,存储内存和执行内存占的比例,执行内存占用资源后,存储内存还可以拿回去吗

10、java:

spring的aop、ioc

springmvc处理一个请求的流程是什么样的

springmvc用了什么设计模式

arrayList底层是什么?与linkList对比

线程池用的多吗?怎么得到一个带返回值的线程

--------------------------------------------

11、hashmap的原理又被问到了,怎么防止hashmap的碰撞问题

12、写个冒泡排序?快排是什么样的

13、说说spark的RDD

14、hdfs有什么结构

15、hive的优化

16、hbase的rowkey设计

17、kafka的数据丢失和重复消费问题

18、jvm中新生代跟老年代的比例

19、线程有什么状态

20、flume有没有碰到过收集到重复数据的问题,怎么解决呢

21、sqoop从两台不同的服务器拉数据的时候,万一服务器时间不同步会有什么情况

22、dubbo是干什么用的,怎么用

数据丢失与重复_大数据面试题分享-恭喜这位朋友刚毕业拿到了20K相关推荐

  1. hive hql文档_大数据学习路线分享hive的运行方式

    大数据学习路线分享hive的运行方式,hive的属性设置: 1.在cli端设置 (只针对当前的session) 3.在java代码中设置 (当前连接) 2.在配置文件中设置 (所有session有效) ...

  2. flink source 同步_大数据面试题-Flink

    1.Flink 的 抽象层次有几种 Stateful stream processing Core API Table SQL 2.Window 类型 (1)TimeWindow Tumbling W ...

  3. 大数据面试题Spark篇(1)

    目录 1.spark数据倾斜 2.Spark为什么比mapreduce快? 3.hadoop和spark使用场景? 4.spark宕机怎么迅速恢复? 5. RDD持久化原理? 6.checkpoint ...

  4. 大数据面试题及答案 100道 (2021最新版)

    大数据面试题及答案[最新版]大数据高级面试题大全(2021版),发现网上很多大数据面试题都没有答案,所以花了很长时间搜集,本套大数据面试题大全 最近由于要准备面试就开始提早看些面试.笔试题.以下是自己 ...

  5. 大数据面试题及答案 汇总版

    版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/albg_boy/article/det ...

  6. 你不知道的BAT大数据面试题

          你不知道的BAT大数据面试题 1.kafka的message包括哪些信息 一个Kafka的Message由一个固定长度的header和一个变长的消息体body组成 header部分由一个字 ...

  7. 大数据知识面试题-Flink(2022版)

    序列号 内容 链接 1 大数据知识面试题-通用(2022版) https://blog.csdn.net/qq_43061290/article/details/124819089 2 大数据知识面试 ...

  8. 5W字讲解最新大数据面试题

    此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待 复习大数据面试题,看这一套就够了! 本文目录: 一.Hadoop 二.Hive ...

  9. (转)大数据面试题130道及答案整理 1-15

    大数据面试题130道及答案整理 1-15 转载自:https://www.cnblogs.com/yuluoxingkong/p/13475235.html 1.HashMap 和 Hashtable ...

最新文章

  1. android 平板安装程序开发者,android – 限制平板电脑中的应用安装
  2. 网站不经意间过度优化了怎么办?有什么解决方案?
  3. IDEA启动项目:找不到或无法加载主类
  4. CodeForces - 1526D Kill Anton(模拟)
  5. input ios问题 小程序_微信小程序开发常见问题汇总
  6. 产品经理如果有捷径,那可能是多读书
  7. 【算法分析与设计】寻找假币问题
  8. 模型计算机控制器的设计,模型计算机控制器的设计.pdf
  9. XenDesktop 5之痛---Database Transaction Log速增
  10. OpenCV学习(13) 细化算法(1)(转)
  11. 零起点英语_【德国零起点】05—变元音字母
  12. 初了解JS设计模式,学习笔记
  13. html怎样在标签中显示图片,HTML-图片标签学习
  14. 沙盒生存游戏:打造世界Craft the World Mac中文版
  15. 9款超级好用的在线PDF工具!
  16. Rust语言教程(2) - 从熟悉的部分开始
  17. sudo: no valid sudoers sources found, quitting
  18. 如何成为“头脑王者”?每天5分钟,让你的大脑准备就绪!
  19. APP第一次请求HTTPS慢
  20. 【lnmp+ELK+Nginx+GeoIP】超详细新版ELK8.5.0解析收集Nginx日志并实现数据可视化与IP地址地图可视化教程-2022年11月版

热门文章

  1. angular-file-upload+springMVC的使用
  2. swift - if let Optional 语法
  3. 前端随笔整理[5.14]
  4. 为了保护眼睛,请调节颜色
  5. iOS原生WebView中JavaScript和OC交互
  6. linux文件夹权限问题
  7. LeetCode77:Combinations
  8. 暑假集训做题,比赛的网站
  9. 降低能耗 企业级闪存进入数据中心领域
  10. 有关 alter tablespace begin backup