在HDFS中所有的Hadoop命令均由bin/hadoop脚本引出,不指定参数运行Hadoop脚本会打印出所有命令的描述。这篇博文总结一下常用的HDFS命令的操作。


一、version命令

version命令可以打印Hadoop版本的详细信息。

$ hadoop version

二、dfsadmin命令

dfsadmin命令可以查看集群存储空间使用情况和各节点存储空间使用情况。

# hadoop dfsadmin -report

三、jar命令

jar命令是运行jar包文件命令。用户可以把他们的MapReduce代码捆绑到jar文件中,使用jar命令使程序运行起来。

hadoop jar <jar> [mainClass]

  • <jar>:jar包
  • [mainClass]:可选选项,指定运行主类

eg:使用"hadoop jar"命令在Hadoop集群中运行WordCount.jar程序,示例如下:

# hadoop jar WordCount.jar

四、fs命令

fs参数是运行通用文件系统参数,在Hadoop后面跟上fs参数,表示是对HDFS中的文件进行操作。

hadoop fs [GENERIC_OPTIONS] [COMMAND_OPTIONS]

  • GENERIC_OPTIONS:通用选项
  • COMMAND_OPTIONS:命令选项

fs常用的基本选项如下:

1. mkdir

mkdir命令可以在HDFS中创建新目录,但它只能创建一级目录。创建多级目录上一级目录必须先存在,或是使用-p参数。

hadoop fs -mkdir <paths>

eg1:使用mkdir命令在HDFS中分别在input目录下创建一个file2目录、在output目录下也创建一个file2目录

hadoop fs -mkdir /input/file2 /output/file2

eg2:使用mkdir命令在HDFS中创建一个多级目录/file/file1/file2/file3

hadoop fs -mkdir -p /file/file1/file2/file3

2. touchz

touchz命令可以在HDFS中创建一个0字节的空文件。

hadoop fs -touchz <hdfs:newFile>

3. du & dus & ls & lsr

du命令是显示文件或文件夹属性的命令,可以显示(多个)指定文件、(多个)指定目录中所有文件的大小

dus命令可以显示指定(多个)文件目录的大小

ls命令可以在HDFS中显示指定文件的详细内容。如果是目录,则返回它直接子文件的列表。详细内容包括:权限、用户、文件所在组、文件大小、创建日期和路径等信息。

lsr命令是ls -R简写,是用来递归显示HDFS中指定目录下的所有子文件的详细信息

hadoop fs -du <hdfs:pathDirectory>

hadoop fs -dus <hdfs:pathDirectory>

hadoop fs -ls <hdfs:pathDirectory>

hadoop fs -lsr <hdfs:pathDirectory>

4. cat

cat命令可以在HDFS中查看指定文件或指定文件夹下所有文件内容。

hadoop fs -cat <hdfs:pathfile>

eg:查看HDFS中input目录下所有文件内容

hadoop fs -cat /input/*

注:/input/*中的*表示input目录下的所有文件,/input/part*中的*指的是input目录下所有以part开始的文件。

5. put & get & getmerge

put命令可以从本地文件系统中复制单个或多个源路径到目标文件系统。HDFS中接收文件的目录必须事先存在

get命令从HDFS中复制指定文件、指定多个文件或指定目录下所有文件,到本地文件目录。在执行get之前,本地文件目录必须事先存在,get是一种常用的下载命令。

getmerge命令将HDFS中指定目录下的所有文件加载到本地中。如果文件名不存在将在本地新创建文件,如果文件名存在,则覆盖文件内所有内容。

hadoop fs -put <local:pathFile> [local:pathFile] <hdfs:pathDirectory>

hadoop fs -get <hdfs:pathFile> <local:pathDirectory>

hadoop fs -getmerge <hdfs:pathDirectory> <hdfs:pathFile>

eg1:从本地上传city_data文件和monitor_data文件到HDFS的test目录中

hadoop fs -put city_data monitor_data /test

eg2:在HDFS中复制input目录下的word_count文件到本地file目录中

hadoop fs -get /input/word_count ~/file

6. copyFromLocal & copyToLocal

二者和put/get命令很像,但是copyFromLocal是将本地文件上传到HDFS中(源地址必须是本地文件地址),copyToLocal是将HDFS中的文件下载到本地(源路径只能是一个本地文件,get的源路径可能是多个文件,也可能是标准输入)。

hadoop fs -copyFromLocal <local:pathFile> <hdfs:pathDirectory>

hadoop fs -copyToLocal <hdfs:pathFile> <local:pathDirectory>

7. cp

cp(copy)命令可以将HDFS中的指定文件复制到HDFS中目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录

hadoop fs -cp <hdfs:pathFile> <hdfs:pathDirectory>

8. mv & rm & rmr

mv命令可以在HDFS中将文件从源路径移动到目标路径,这个命令允许有多个源路径,此时目标路径必须是一个目录。

rm命令用于删除一个指定的文件或多个指定的文件的命令,加上“-r”参数可以删除指定目录。

rmr命令等价于rm -r命令,可以删除目录或递归删除子文件,如果使用-rmr命令删除一个目录时,不管目录下是否有其他文件,均将一并删除。

hadoop fs -mv <hdfs:sourcepath> [hdfs:sourcepath...] <hdfs:targetpath>

hadoop fs -rm <hdfs:pathFile> [hdfs:pathFile]

hadoop fs -rmr <hdfs:pathDirectory> [hdfs:pathDirectory]

eg1:将HDFS中的/input/major文件移动到/file/file1/file2中

hadoop fs -mv /input/major /file/file1/file2

eg2:hadoop fs -rm /test/city_data /test/monitor_data

eg3:hadoop fs -rmr /test /file

9. tail

tail命令可以将文件尾部1KB的内容输出到标准输出。并且tail命令支持“-f”选项,加上“-f”选项表示实时显示文件内容。

hadoop fs -tail [-f] <hdfs:pathFile>

10. text

text命令可以将HDFS中的源文件以文本格式输出。

hadoop fs -text <hdfs:pathFile>

11. expunge

expunge命令的字面意思是“清除”,它在Hadoop中的作用是清空回收站。

hadoop fs -expunge


以上是常用的HDFS命令的总结,除此之外,还可以使用Java API对HDFS中的文件进行操作,等我学完后再做补充。

HDFS常用命令总结相关推荐

  1. java向hdfs提交命令_Java语言操作HDFS常用命令测试代码

    本文主要向大家介绍了Java语言操作HDFS常用命令测试代码,通过具体的内容向大家展示,希望对大家学习JAVA语言有所帮助. package com.yxc.hdfs; import org.apac ...

  2. HDFS常用命令的学习

    HDFS常用命令的学习 文章目录 HDFS常用命令的学习 1. hadoop fs,hadoop dfs,hdfs fs,hdfs dfs 区别 2. Hadoop 命令 3. HDFS 常用命令 命 ...

  3. HDFS常用命令汇总

    HDFS常用命令汇总 一.前言信息 二.帮助信息查看 1.查看帮助信息 2.帮助文档(附带命令的详细说明) 三.常用命令 1.创建目录 2.查看目录下的内容 3.上传文件 4.上传并删除源文件 5.查 ...

  4. HDFS常用命令hdfs dfs

    1.hdfs dfs.hadoop fs.hadoop dfs三个命令的区别 在介绍命令之前,首先要知道hdfs dfs.hadoop fs.hadoop dfs三个命令的区别. hadoop fs: ...

  5. 熟悉常用的HDFS操作(附录HDFS常用命令)

    文章目录 1. 学习目的 2. 学习内容 3. 实验一 3.1 追加文本 3.2 覆盖文本 3.3 脚本完成 4. 实验二 4.1 下载文件脚本 4.2 输出文件内容脚本 4.3 显示单个文件信息脚本 ...

  6. HDFS文件系统(含hdfs常用命令,java对hdfs API的简单操作)

    HDFS文件系统 HDFS概念 什么是HDFS HDFS的组成 HDFS文件块大小 HFDS命令行操作 基本语法 常用命令 Java操作hdfs 配置编译环境 获取文件系统 上传文件 文件下载 目录创 ...

  7. Hadoop HDFS常用命令

    在Linux命令行终端,我们可以利用Shell命令对Hadoop进行操作.利用这些命令可以完成HDFS中文档的上传.下载.复制.查看文件信息.格式化名称节点等操作.关于HDFS的Shell命令有一个统 ...

  8. hadoop学习笔记(四):hdfs常用命令

    一.hadoop fs 1.创建目录 [root@master hadoop-2.7.0]# hadoop fs -mkdir /testdir1 [root@master hadoop-2.7.0] ...

  9. Hadoop Shell命令-hdfs常用命令

    Hadoop Shell命令-hdfs Hadoop Shell命令 cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge ...

  10. 分布式文件系统HDFS常用命令

    1:查看所有命令 hdfs dfs 2:查看目录下的文件列表 hdfs dfs -ls / 3:查看某文本文件的内容 hdfs dfs -cat /tmp/yy.txt 4:创建目录 hdfs dfs ...

最新文章

  1. mysql buffer used_MySQL性能调优(软调优)
  2. python密码学编程pdf-Python密码学编程PDF电子书免费下载
  3. javase 超市库存系统
  4. 演化计算简单实例(附代码)
  5. Java 编程的动态性,第 5 部分: 动态转换类--转载
  6. Python接口测试之requests
  7. Elasticsearch全量数据增量遍历实现原理
  8. JS跳转手机QQ的聊天页面
  9. python数独游戏源代码100行_python实现自动解数独小程序
  10. Nginx应用场景之反向代理
  11. 95-150-080-源码-Sink-StreamingFileSinkBucketingSink
  12. 长沙学院计算机系课程表,长沙交通学院研究生200—200学年度第学期课程表.doc...
  13. Stanford Parser的学习之开篇(一)
  14. C# 设置Windows程序窗口为穿透状态
  15. Win7下 安全、彻底删除Orcale数据库
  16. excel教程自学网_超实用!良心推荐15个神级自学网站,内容全面质量又高
  17. Video.js 使用教程 - 手把手教你基于 Vue 搭建 HTML 5 视频播放器
  18. golang emoji表情处理
  19. 桌面上 计算机 回收站不见了怎么办,桌面上的回收站图标不见了怎么办
  20. 数据结构作业——Sanji(优先队列)

热门文章

  1. 这件小事,我坚持了 200 天
  2. Sublime Text编辑器设置中文
  3. 计算机行显示性能调整,win7系统怎么调节为最佳性能模式-win7性能,win7运行速度提高90%...
  4. 解决dll load failed while importing qtgui
  5. 微信小程序wxml传递值总结(e.currentTarget,e.detail.value)
  6. 锐文科技发布基于国产FPGA的智能网卡芯片
  7. 计算机网络中ipv6什么意思,路由器ipv6是什么意思(图文)
  8. 学计算机每天应该吃什么,长期坐在电脑前的上班族吃什么食物好
  9. 前端用JS + SVG 实现关系图谱 流程图
  10. TP6微信公众号登陆授权