hadoop
--------------
分布式计算框架。

common //
hdfs //存储
mapreduce //MR,编程模型.
yarn //资源调度.

集群部署
-----------
1.standard alone/local
nothing.
2.伪分布式
一台机器.
NN //目录
DN //DataNode,block(128M)
//
RM
NM
2NN
3.
4.
5.

jar

项目管理
--------------------
pom.xml
artifact //

安装maven
----------------
项目管理软件。
软件之间的依赖关系。
${user_hoime}/.m2
[windows]
1.加压即可
不要放中文或空格目录。
2.配置环境变量.
M2_HOME=c:\myprograme\apache-maven-3.3.9
PATH=...;%M2_HOME%\bin

3.验证是否安装成功
cmd>mvn -v

4.修改默认的仓库位置
[${maven_home}/conf/setttings.xml]
<settings ...>
...
<localRepository>e:/repo</localRepository>
...
</settings>

5.配置idea使用指定settings.xml文件.

[Centos]
1.tar开文件
/soft/apache-maven-3.3.9
/soft/maven --> maven-3.3.9
2.配置环境
[/etc/profile]
M2_HOME=/soft/maven
PATH=$PATH:$M2_HOME/bin

3.验证是否成功
$>mvn -v

安转idea
-----------------
1.右键点击ideaIU-2016.3.2.exe文件,选择管理员身份运行.
2.打开idea.
3.
4.
5.

依赖
-------------
<dependency>
<!-- 组id,解析成目录org/apache/hadoop/hadoop-hdfs/2.7.3 -->
<groupId>org.apache.hadoop</groupId>
<!-- 工件id -->
<artifactId>hadoop-hdfs</artifactId>
<!-- 版本 -->
<version>2.7.3</version>
</dependency>

eclipse idea
--------------------------
工作空间 项目
项目 模块

hadoop
--------------
http://s201:50070/

1073742863 == 134217728
1073742864 == 79874467

hdfs常见操作
-------------------
1.查看hdfs帮助
$>hdfs
2.hdfs dfs

3.hdfs

配置hadoop的最小blocksize,必须是512的倍数。
-------------------------------------------
[hdfs-site.xml]
dfs.namenode.fs-limits.min-block-size=1024
write,进行校验,512进行一次教研。

单独配置辅助名称节点
---------------------
[hdfs-site.xml]
dfs.namenode.secondary.http-address=s126:50090

使用oiv命令查询hadoop镜像文件
------------------------------
hdfs oiv -i fsimage -o a.xml -p XML //查看镜像文件。

hdfs dfsadmin管理命令
----------------------
$>hdfs dfsadmin //查看帮助
$>hdfs dfsadmin -help rollEdits //查看指定命令的帮助
$>hdfs dfsadmin -rollEdits //滚动编辑日志

启动hdfs时,镜像文件编辑日志进行融合,编辑日志滚动。

查看hdfs是否在安全模式
------------------------
$>hdfs dfsadmin -safemode enter //进入
$>hdfs dfsadmin -safemode get //查看
$>hdfs dfsadmin -safemode leave //退出
$>hdfs dfsadmin -safemode wait //等待

hadoop
--------------------
$>hadoop fs //hdfs dfs
$>hadoop checknative //检查压缩库本地安装情况
$>hadoop namenode -format //格式化名称

hdfs管理命令
--------------------
hdfs dfsadmin //

保存名字空间,需要进入安全模式
--------------------------------
$>hdfs dfsamdin -saveNamespace

hadoop启动命令
------------------
$>start-all.sh //start-dfs.sh + start-yarn.sh
$>start-dfs.sh //hadoop-daemon.sh start namenode
//hadoop-daemons.sh start datanode
$>start-yarn.sh //yarn-daemon.sh start resourcemanager
//yarn-daemons.sh start nodemanager

配额管理(quota)
-------------------
[目录配额]
计算目录下的所有文件的总个数。如果1,表示空目录。
$>hdfs dfsadmin -setQuota 1 dir1 dir2 //设置目录配额
$>hdfs dfsadmin -clrQuota 1 dir1 dir2 //清除配额管理

[空间配额]
计算目录下的所有文件的总大小.包括副本数.
空间配置至少消耗384M的空间大小(目录本身会占用384M的空间)。
$>hdfs dfsadmin -setSpaceQuota 3 data
$>echo -n a > k.txt
$>hdfs dfs -put k.txt data2
$>hdfs dfsadmin -clrSpaceQuota dir1 //清除配额管理

快照管理
--------------------
1.描述
迅速对文件(夹)进行备份。不产生新文件,使用差值存储。
默认是禁用快照,先启用。
2.命令
$>hdfs dfsadmin -allowSnapShot dir1 //在dir1启用快照
$>hdfs dfsadmin -disallowSnapShot dir1 //在dir1启用快照
$>hdfs dfs -createSnapshot dir ss1 //创建快照
$>hdfs dfs -renameSnapshot dir ss1 ss2 //重命名
$>hdfs dfs -deleteSnapshot dir ss1 //删除快照

slaves

黑白名单的组合情况
-------------------------
include //dfs.include
exclude //dfs.hosts.include

include exclude Interpretation
No No 不能连接
No Yes 不能连接
Yes No 可以连接
Yes Yes 可以连接,将会退役状态。

节点的服役和退役(hdfs)
----------------------
[添加新节点]
1.在dfs.include文件中包含新节点名称,该文件在nn的本地目录。
[白名单]
[s201:/soft/hadoop/etc/dfs.include.txt]
s202
s203
s204
s205
2.在hdfs-site.xml文件中添加属性.
<property>
<name>dfs.hosts</name>
<value>/soft/hadoop/etc/dfs.include.txt</value>
</property>

3.在nn上刷新节点
$>hdfs dfsadmin -refreshNodes

4.在slaves文件中添加新节点ip(主机名)
s202
s203
s204
s205 //新添加的

5.单独启动新的节点中的datanode
[s205]
$>hadoop-daemon.sh start datanode

[退役]
1.添加退役节点的ip到黑名单,不要更新白名单.
[/soft/hadoop/etc/dfs.hosts.exclude.txt]
s205

2.配置hdfs-site.xml
<property>
<name>dfs.hosts.exclude</name>
<value>/soft/hadoop/etc/dfs.hosts.exclude.txt</value>
</property>

3.刷新nn节点
$>hdfs dfsadmin -refreshNodes

4.查看webui,节点状态在decommisstion in progress.

5.当所有的要退役的节点都报告为Decommissioned,数据转移工作已经完成。

6.从白名单删除节点,并刷新节点
[s201:/soft/hadoop/etc/dfs.include.txt]
...

$>hdfs dfsadmin -refreshNodes

7.从slaves文件中删除退役节点

节点的服役和退役(yarn)
----------------------
[添加新节点]
1.在dfs.include文件中包含新节点名称,该文件在nn的本地目录。
[白名单]
[s201:/soft/hadoop/etc/dfs.include.txt]
s202
s203
s204
s205
2.在yarn-site.xml文件中添加属性.
<property>
<name>yarn.resourcemanager.nodes.include-path</name>
<value>/soft/hadoop/etc/dfs.include.txt</value>
</property>

3.在nn上刷新节点
$>yarn rmadmin -refreshNodes

4.在slaves文件中添加新节点ip(主机名)
s202
s203
s204
s205 //新添加的

5.单独启动新的节点中的nodemananger
[s205]
$>yarn-daemon.sh start nodemananger

[退役]
1.添加退役节点的ip到黑名单,不要更新白名单.
[/soft/hadoop/etc/dfs.hosts.exclude.txt]
s205

2.配置yarn-site.xml
<property>
<name>yarn.resourcemanager.nodes.exclude-path</name>
<value>/soft/hadoop/etc/dfs.hosts.exclude.txt</value>
</property>

3.刷新rm节点
$>yarn rmadmin -refreshNodes

4.查看webui,节点状态在decommisstion in progress.

5.当所有的要退役的节点都报告为Decommissioned,数据转移工作已经完成。

6.从白名单删除节点,并刷新节点

$>yarn rmadmin -refreshNodes

7.从slaves文件中删除退役节点

安装rose
---------------
0.UML
统一建模语言。
画图。
use case //用例
class //
1.安装dtlite虚拟光驱
2.打开虚拟光驱.

转载于:https://www.cnblogs.com/YuanWeiBlogger/p/11530831.html

hadoop 空间配置相关推荐

  1. 【深入理解Hadoop原理】Hadoop 参数配置 详解

    Hadoop 参数配置 详解 一.常用端口 组件 节点 默认端口 配置 用途说明 HDFS DataNode 50010 dfs.datanode.address datanode服务端口,用于数据传 ...

  2. malloc开辟的空间在哪一个区间_C++进阶系列之STL(2)SGI版本空间配置器

    1.STL中的空间配置器在STL中,空间配置器分了2组,分别为一级空间配置器和二级空间配置器,但是它们都有自己各自运用的场合:一般说来,一级空间配置器一般分配的空间大于128B,二级空间配置器的分配空 ...

  3. 2.1 空间配置器(allocator)

    空间配置器隐藏在一切组件之后. 1.1 设计一个简单的空间配置器 根据STL的规范,以下是allocator的必要接口: allocator::value_type allocator::pointe ...

  4. 5.Hadoop的学习(Hadoop的配置(伪分布式的搭建)-1)

    1.Hadoop的配置 独立模式.伪分布式.完全分布式 2.安装完之后就已经是独立模式了. (1)在独立模式之下是没有守护进程的,可以输入命令 jps   会发现只有一个Jps,没有其他守护进程. ( ...

  5. stl源码剖析_《STL源码剖析》学习笔记——空间配置器

    目录 1. 空间配置器概述 2. 构造和析构基本工具 3. 空间的配置与释放,std::alloc 4. 内存基本处理工具 1. 空间配置器概述 从STL的实现角度来看,空间配置器的位置尤为重要,整个 ...

  6. STL源码剖析---空间配置器

    看过STL空间配置器的源码,总结一下:       1.STL空间配置器:主要分三个文件实现,stl_construct.h  这里定义了全局函数construct()和destroy(),负责对象的 ...

  7. Ch2 空间配置器(allocator) ---笔记

    2.1 空间配置器的标准接口 allocator的必要接口: allocator::value_type allocator::pointer allocator::const_pointer all ...

  8. C++ STL : SGI-STL空间配置器源码剖析

    文章目录 空间配置器的概念 SGI-STL空间配置器 一级空间配置器 二级空间配置器 申请空间 补充内存块 从内存池中索要空间 空间回收 内存碎片 外碎片 内碎片 空间配置器的再次封装 空间配置器的概 ...

  9. STL中的空间配置器

    STL中的空间配置器 文章目录 STL中的空间配置器 1. 什么是空间配置器 2. 为什么需要空间配置器 3. SGI-STL空间配置器实现原理 3.1 一级空间配置器 3.2 二级空间配置器 3.1 ...

  10. 详解STL中的空间配置器(SGI版本)

    空间配置器 1.什么是空间配置器 为各个容器高效的管理空间(空间的申请与回收)的 2.为什么需要空间配置器 各种容器----->可以存放元素---->底层需要空间 new 申请空间 ope ...

最新文章

  1. 2022-2028年中国量子点膜行业市场调查分析及未来前景分析报告
  2. CVPR 2021评审出炉,得分惨不忍睹,面对奇葩评审该如何反击?
  3. html5播放视频闪退,【报Bug】embed闪退
  4. 如何优化 Java 性能?
  5. eclipse中去掉警告提示
  6. Three.js 学习笔记 - 给跳一跳小游戏添加光源,阴影
  7. netflix-hystrix-简例
  8. @SuppressWarnings注解的详解
  9. Java面试宝典2018
  10. 【keytool】keytool查看jks证书详情
  11. 菜菜之路-C语言求阶乘和
  12. 【总结整理】高德LBS开放平台学习
  13. JQuery日历 日期选择
  14. 【数学建模】(五):MATLAB程序设计与积分
  15. 笔记本电脑连接无线网总是突然断网
  16. STM32F1xx_StdPeriph_Driver——SPI
  17. u盘容量变小了是什么原因?怎么恢复数据?
  18. 腾讯主机安全“猎刃计划”发布,WebShell挑战赛再燃起,PHPer燥起来
  19. 2020年FRM考试有哪几门?占比是多少?
  20. 2022年氯化工艺考试内容及氯化工艺考试报名

热门文章

  1. 计算机c盘如何扩容,C盘满了怎么办?电脑C盘扩容图文教程-电脑教程
  2. Chrome拓展插件篇
  3. android 腾讯地图demo,腾讯地图调用Demo
  4. 初期学习K60遇到的常见问题及解决办法
  5. 音视频是怎样实现传输的
  6. 组合逻辑电路的分析与设计
  7. SourceInsight查看java源代码
  8. Unity 按钮脚本
  9. 计算机二级公共基础知识易错点汇总
  10. c语言背包问题(动态规划解法)