完整的Hadoop安装包中包括了所有的核心组件,主要有HDFS、MapReduce、Yarn、Client这几个。

安装目录

  • bin:放着Hadoop最基本的管理脚本和使用脚本,sbin目录下管理脚本就是依赖这儿的脚本来实现的,用户也可以直接使用这些脚本管理和使用Hadoop。
  • etc:配置文件所在的目录,包括:core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml等配置文件。
  • include:对外提供的编程库头文件(具体的动态库和静态库在lib目录中),相当于HDFS和MapReduce的C++ API。
  • lib:包含了Hadoop对外提供的编程动态库和静态库,与include目录中的头文件结合使用。
  • libexec:各个服务对应的shell,可用于配置日志输出目录、启动参数(比如JVM参数)等基本信息。
  • sbin:管理脚本所在目录,主要包含HDFS和YARN中各类服务启动/关闭的脚本。
  • share:下面有两个目录,hadoop目录:各个模块编译后的组件Jar包所在目录;doc目录中包含了Hadoop文档。

数据目录

  • 临时目录:hadoop.tmp.dir的目录默认指向的是:/tmp/hadoop-${USERNAME},修改配置在core-site.xml,加一个名字为"hadoop.tmp.dir"的property。
  • HDFS的数据(Namenode本地目录和Datanode数据块),位置是在hdfs-site.xml中配置的dfs.namenode.name.dir和dfs.namenode.data.dir。分别是存储hdfs元数据信息和数据的目录,如果没有配置则默认存储到临时目录。
  • 日志数据,位置是log4j.properties中的配置。默认放在${HADOOP_HOME}/logs/,${HADOOP_HOME}则是系统参数。

hadoop yarn 获取日志_「大数据」「Hadoop」-安装及数据目录相关推荐

  1. hadoop yarn 获取日志_赵丽颖固然漂亮,可这份Hadoop核心教程也不差啊!

    阿里巴巴采用了 15 个节点组成的 Hadoop 集群,用于处理从数据库中导出的商业数据的排序和组合. Ebay 使用了 32 个节点组成的集群,包括 8 * 532 个计算核心以及 5.3 PB 的 ...

  2. hadoop yarn 获取日志_在 YARN 中简化用户日志的管理和使用

    Hadoop 的用户日志有很多的用途, 首先最重要的是, 它们能用来调试 MapReduce 应用(application)的问题, 可能是应用本身的问题, 或者在极少数的情况下, 当在集群中执行应用 ...

  3. CNCC 2018 今日开幕,五场特邀报告引爆「大数据推动数字经济」| CNCC 2018

    雷锋网(公众号:雷锋网) AI 科技评论按,2018 中国计算机大会(CNCC2018)于 10 月 25-27 日在杭州国际博览中心举办,会议由中国计算机学会(CCF)主办,杭州市萧山区人民政府.浙 ...

  4. hadoop yarn 获取日志_Hadoop YARN日志查看方式

    点击关注上方"知了小巷", 设为"置顶或星标",第一时间送达干货. Hadoop YARN日志查看方式 实验环境CDH6.3.2 Hadoop版本 $ hado ...

  5. hadoop hive集群_失眠大数据专家,基于Hadoop不同版本搭建hive集群(附配置文件)

    前言 本教程采用了两种方案 一种是hive-1.21版本,hadoop版本为hadoop2.6.5 还有一种是主要讲基于hadoop3.x hive的搭建 先来第一种 一.本地方式(内嵌derby) ...

  6. hadoop jar包_【大数据学习】Hadoop的MR分布式开发小实战

    前提:hadoop集群应部署完毕. 一.实战科目 做一个Map Reduce分布式开发,开发内容为统计文件中的单词出现次数. 二.战前准备 1.本人在本地创建了一个用于执行MR的的文件,文件中有209 ...

  7. hadoop yarn 获取日志_Hadoop YARN配置参数剖析(2)—权限与日志聚集相关参数

    注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患.另外,这些参数均需要在yarn-site.xml中配置. 1.    权限相关配置参数 这里的权限由三部分组成,分别是:( ...

  8. 大数据技术之Hadoop分布式文件系统HDFS系统知识整理(从入门到熟练操作)

    系列博客 1.大数据技术之Hadoop完全分布式集群搭建+Centos7配置连通外网和主机 2.大数据技术之Hadoop编译源码 3.大数据技术之Hadoop分布式文件系统HDFS系统知识整理(从入门 ...

  9. 大数据Hadoop教程-学习笔记01【大数据导论与Linux基础】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程,总时长:14:22:04 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g,提取码: ...

最新文章

  1. 参加UI培训就业多长时间
  2. 爬虫图片href是html图片,python爬虫取图片详解,
  3. 抛弃ELK!Loki日志系统详解!
  4. Web项目MySQL配置文件运维
  5. 扎扎扎扎扎扎扎扎扎扎扎扎扎扎扎扎扎扎扎扎扎扎心了
  6. JAVA NIO编程入门(二)
  7. MYSQ 查看 2 进制日志
  8. [js] 使用delete删除数组,其长度会改变吗
  9. java resource file_Java 获取Resource目录下的文件解决办法
  10. 解决main No MyBatis mapper was found in 的警告
  11. 跨交换机间单臂路由的实现方法
  12. 利用Runtime为Category添加属性
  13. HDU 1596 find the safest road (最短路)
  14. DB2错误信息(按sqlcode排序)
  15. ESP32的智能药箱-WEB定时-舵机和语音控制-OLED实时时间显示
  16. IDEA设置主题样式
  17. 社区版pycharm的django创建app失败问题解决
  18. 高数_第5章常微分方程_二阶微分方程
  19. 概率抽奖常用两种方式
  20. 文盾信息非结构化数据安全解决方案,高效防护企业文档安全

热门文章

  1. 基于神经网络的毕设题目_新资源科技核心题目
  2. mysql主从同步 忽略表_mysql 主从同步时忽略指定的表
  3. java对jna的配置选项_JNA编程之一:入门 | 学步园
  4. 标准IO库fgets和fputs对一个文本文件的读写操作
  5. CSDN联合腾讯云重磅发布“腾讯云数据库TDSQL工程师路线图”
  6. 三段诡异的JavaScript代码,结果出乎意料
  7. HarmonyOS 生态最重的拼图,手机开发者 Beta 版终于到来
  8. 万字长文讲解编码知识,看这文就够了!| 原力计划
  9. 5G 十项全能、搭载麒麟 820 芯片,1899 元起的荣耀 X10 来了!
  10. 小白也能看懂的 Java 异常处理