持续分享有用、有价值、精选的优质大数据面试题

致力于打造全网最全的大数据面试专题题库

11、CDH 集群扩容 10 台机器后,新加入的 Datanode 角色数据相对较少,如何处理 HDFS 的数据分布不均衡的现象呢?

参考答案:
       在内存占用较低的节点上启动 balancer 脚本,将 HDFS 中所有节点的存储值中的最低值和平均值的差值设置为 5%。
       命令: ./start-balancer.sh -threshold 5

12、CDH 监控项从某种角度来说并不是很细粒度,老师课上可能时间有限等原因只是稍微提了一下监控思路,请问您线上是如何监控的呢,能将详细步骤给我们刨析一下吗?

参考答案:

       目前我们产线环境还是以 CDH 监控为主, CDH 的指标还是挺多的,只不过保留的周期不长,对于排障来说基本够用了,当然我们会推进一些监控工具,不过在课堂不会展开细讲,后续有 Flink 监控方面的实战

13、如何基于 CDH 集群监控大量的小文件的呢?衡量小文件标准,以及出现大量小文件在生产环境该如何解决呢?

参考答案:
       CM 解决不了大量小文件的监控,需要额外做其他工作,这块在集群治理里面我们会详细讲;对于怎么衡量小文件的标准,你可以简单认为小于 block size 的文件就是小文件,但是在企业真实情况下小文件问题可能更加严重,比如大量 10M、几十 M 以下的文件,单纯技术无法解决问题,需要组织协同,这个在集群治理里面我们会详细讲。

14、之前上课只是大致提了一下 YARN 资源调度,生产环境使用 CDH 如何配 YARN 资源队列调度,在咱们后续的课程还会讲吗?

参考答案:
       这个会讲解的,也会讲解我们产线环境是如何划分队列的。

15、CDH 如何对 HDFS 各级目录做权限管理,目录的配额(即使用 HDFS 容量限制)限制呢?

参考答案:
       HDFS 可通过 ACL 精细控制目标权限,除了 ACL 后续我们也会讲sentry;目前我们产线环境没有做容量配额限制,怕影响生产,我们通过集群治理来解决容量问题,集群治理是我们的课程内容之一,后续会讲解。

16、Hdfs,Yarn,MapReduce,Hive,Spark,Storm,Kafka,Flink 这些组件您在生产环境的调优参数是如何配置的,后续会为我们分享一些调优参数及说明?我们也方便对照自己的集群作为参考适当调整。

参考答案:
       这个是会的,我们会讲组件的运维、巡检、监控、参数配置、故障排查等课程内容。

17、后期的大数据组件监控项目是针对课上所有的组件进行监控的么?还是只是分享监控思路,代码能给我们学员吗?

参考答案:
       大数据组件监控主要在 CM 上进行监控,后续有集群治理案例实战,实战代码可以给学员的。

18、生产环境中重启 HDFS 集群时时间过程,每次重启都导致 40 分钟左右才能启动成功,需要调优什么参数让 NameNode 快一点变为 Active 呢?为什么调优这些参数后会导致 NameNode 启动加快呢?

参考答案:
1) 降低 BlockReport 时数据规模; NameNode 处理 BR 的效率低主要原因还是每次 BR 所带的 Block 规模过大造成,所以可以通过调整 Block 数量阈值,将一次 BlockReport 分成多盘分别汇报,提高 NameNode 处理效率。可参考的参数为: dfs.blockreport.split.threshold,默认为 1,000,000,当前集群DataNode 上 Block 规模数处于 240,000 ~ 940,000,建议调整为 500,000;
2) 当需要对全集群的 DataNode 重启操作,且规模较大(包括集群规模和数据规模)时,建议在重启 DataNode 进程之后将 NameNode 重启,避免前面的“雪崩”问题;
3) 控制重启 DataNode 的数量;按照当前节点数据规模,如果大规模重启DataNode,可采取滚动方式,以每次 15 个实例, 单位间隔 1min 滚动重启,如果数据规模增长,需要适当调整实例个数;

19、生产环境中我们有必要利用 CM "图表生成器"来自定义图标形成仪表盘?如果有必要,官方提供的度量值太多了,您在是生产环境中都定义了哪些监控图标呢?

参考答案:
       这个我们会在正式课中 CM 监控章节进行讲解,主要是主机以及各个组件的核心指标,当出现问题之后再去查看其他指标即可。

20、在录播视频中安装 Spark,Hive 选择依赖是 HDFS,那什么情况下Spark,Hive 需要依赖 HBase 呢?如果 Spark 和 Hive 依赖关系开始选择的是只依赖于 HDFS,后期想要改成依赖 HBase 该如何操作呢?老师您能用大白话给我们解释一下这个依赖关系是干嘛的吗?

参考答案:
       依赖就是想要使用 Spark 和 Hive 分析读取谁的数据,依赖 HDFS 就是使用 Spark 和 Hive 读取 HDFS 数据进行分析,依赖 HBase 就是使用使用 Spark和 Hive 读取 HBase 数据进行分析。
       在实际的产线环境中很少使用 Spark 和 Hive 依赖 HBase,大多时候都是依赖 HDFS,即读取 HDFS 的数据进行分析,如果后续想要依赖 HBase 再添加第二个 Spark 或 HIve 即可。

持续分享有用、有价值、精选的优质大数据面试题

致力于打造全网最全的大数据面试专题题库

【300+精选大厂面试题持续分享】大数据运维尖刀面试题专栏(二)相关推荐

  1. 【300+精选大厂面试题持续分享】大数据运维尖刀面试题专栏(四)

    持续分享有用.有价值.精选的优质大数据面试题 致力于打造全网最全的大数据面试专题题库 31.如果发现现有集群出现数据倾斜,生产环境中 HBase 出现数据倾斜了该如何解决呢?出现数据倾斜的原因到底是什 ...

  2. 【300+精选大厂面试题持续分享】大数据运维尖刀面试题专栏(九)

    持续分享有用.有价值.精选的优质大数据面试题 致力于打造全网最全的大数据面试专题题库 81.hdfs数据块的默认大小是多少?过大过小有什么优缺点? 参考答案: 1.数据块默认大小 Hadoop2.0之 ...

  3. 【300+精选大厂面试题持续分享】大数据运维尖刀面试题专栏(十)

    持续分享有用.有价值.精选的优质大数据面试题 致力于打造全网最全的大数据面试专题题库 91.首次启动 HDFS 时,必须对其进行格式化操作的命令? 参考答案: bin/hdfs namenode -f ...

  4. 【300+精选大厂面试题持续分享】大数据运维尖刀面试题专栏(八)

    持续分享有用.有价值.精选的优质大数据面试题 致力于打造全网最全的大数据面试专题题库 71.Zookeeper的典型应用场景有哪些? 参考答案: Zookeeper是一个典型的发布/订阅模式的分布式数 ...

  5. 【300+精选大厂面试题持续分享】大数据运维尖刀面试题专栏(十五)

    持续分享有用.有价值.精选的优质大数据面试题 致力于打造全网最全的大数据面试专题题库 136.以你的实际经验,说下怎样预防全表扫描? 参考答案: 1)应尽量避免在where 子句中对字段进行null ...

  6. 【300+精选大厂面试题持续分享】大数据运维尖刀面试题专栏(十四)

    持续分享有用.有价值.精选的优质大数据面试题 致力于打造全网最全的大数据面试专题题库 131.hive性能调优的常见方法? 参考答案: (1)HQL层面优化 1)利用分区表优化 2)利用桶表优化 3) ...

  7. 【300+精选大厂面试题持续分享】大数据运维尖刀面试题专栏(十三)

    持续分享有用.有价值.精选的优质大数据面试题 致力于打造全网最全的大数据面试专题题库 116.怎么解决MapReduce的数据倾斜? 参考答案: 现象:Mapreduce程序在运行的时候,运行了大部分 ...

  8. 大数据运维方向面试题

       一.基础题 1.请写出http和https请求的区别,并写出遇到过的响应状态码.   一.https协议需要到ca申请证书,一般免费证书很少,需要交费. 二.http是超文本传输协议,信息是明文 ...

  9. 大讲台大数据运维尖刀班4期

    硬件优化 在上线一个业务系统之前,首先需要进行硬件采购.硬件采购的标准是业务系统的运行特点和对资源的占用情况. 举例一:如果要上线一套 Redis 集群 Redis 是内存数据库,特点是占用内存会非常 ...

最新文章

  1. GitHub 热门:机器学习 100 天!
  2. 人工智能及其应用(第5版).蔡自兴-4章课后习题。【部分参考答案】
  3. Windows下安装MySQL 5.7.26 及注意事项
  4. 【Spark深入学习 -14】Spark应用经验与程序调优
  5. uinty中对Xml文件的操作
  6. 噪声产生原因_想要解决音响噪声,得先看这五大原因
  7. 你画的流程图,全组人都能看得懂吗?
  8. 模拟退火算法(TSP问题)
  9. 20155320 2016-2017-2 《Java程序设计》第五周学习总结
  10. JAVA读、写EXCEL文件
  11. prototype.js学习(1)
  12. RS485自动切换电路:数据收发原理
  13. c 教程网 linux,Linux基本命令C教程网cppcoursecom.ppt
  14. SDN概述,SDN是什么?
  15. FTPserver 配置
  16. 云班课python答案_云班课测试题答案公众号
  17. 权限管理框架实现(1)--Struts切面处理
  18. Windows变慢原因分析
  19. atoi()函数的实现
  20. 百度深度学习框架paddlepaddle实战三——自家车牌识别

热门文章

  1. 学习BLE蓝牙一个月总结
  2. 【DRP项目】安装Oracle数据库之服务端安装+客户端安装(一)
  3. 淘宝/天猫获得淘宝商品详情高级版 API
  4. Unity 获取鼠标点击图片时 获取点击位置的像素
  5. 还在纠结配色问题?手把手教你用MATLAB一键生成高质量色卡
  6. web端安全测试工具
  7. LTE:RA-RNTI、T-CRNTI、C-RNTI
  8. ICLR 2021|基于GAN的二维图像无监督三维形状重建
  9. java毕业设计“西单”甜品线上预定系统mybatis+源码+调试部署+系统+数据库+lw
  10. dnf内存教学视频教程分析讲解