1. 前言

HDFS命令基本格式:hadoop fs -cmd < args >


2. ls 命令

hadoop fs -ls /
列出hdfs文件系统根目录下的目录和文件

hadoop fs -ls -R /
列出hdfs文件系统所有的目录和文件


3. put 命令

hadoop fs -put < local file > < hdfs file >
hdfs file的父目录一定要存在,否则命令不会执行

hadoop fs -put < local file or dir >…< hdfs dir >
hdfs dir 一定要存在,否则命令不会执行


4. get 命令

hadoop fs -get < hdfs file > < local file or dir>
local file不能和 hdfs file名字不能相同,否则会提示文件已存在,没有重名的文件会复制到本地

hadoop fs -get < hdfs file or dir > … < local dir >
拷贝多个文件或目录到本地时,本地要为文件夹路径


5. rm 命令

hadoop fs -rm -r -f < hdfs file > …
删除单个文件

hadoop fs -rm -r < hdfs dir>…
每次可以删除多个文件或目录


6. mkdir 命令

hadoop fs -mkdir < hdfs path>
只能一级一级的建目录,父目录不存在的话使用这个命令会报错

hadoop fs -mkdir -p < hdfs path>
所创建的目录如果父目录不存在就创建该父目录


7. cp 命令

hadoop fs -cp < hdfs file > < hdfs file >
目标文件不能存在,否则命令不能执行,相当于给文件重命名并保存,源文件还存在

hadoop fs -cp < hdfs file or dir >… < hdfs dir >
目标文件夹要存在,否则命令不能执行


8. mv 命令

hadoop fs -mv < hdfs file > < hdfs file >
目标文件不能存在,否则命令不能执行,相当于给文件重命名并保存,源文件不存在

hadoop fs -mv < hdfs file or dir >… < hdfs dir >
源路径有多个时,目标路径必须为目录,且必须存在。


9. count 命令

hadoop fs -count < hdfs path >
统计hdfs对应路径下的目录个数,文件个数,文件总计大小
显示为目录个数,文件个数,文件总计大小,输入路径


10. du 命令

hadoop fs -du < hdsf path>
显示hdfs对应路径下每个文件夹和文件的大小

hadoop fs -du -s < hdsf path>
显示hdfs对应路径下所有文件和的大小

hadoop fs -du - h < hdsf path>
显示hdfs对应路径下每个文件夹和文件的大小,文件的大小用方便阅读的形式表示,例如用64M代替67108864


11. text 命令

hadoop fs -text < hdsf file>
将文本文件或某些格式的非文本文件通过文本格式输出


12. tail 命令

hadoop fs -tail < hdfs file >
在标准输出中显示文件末尾的1KB数据


13. 操作演示

(1) 列出HDFS下的文件
hadoop fs -ls /
(2) 上传文件
将hadoop目录下的test1文件上传到HDFS上并重命名为test:
hadoop fs -put ./test1 /test
(3) 文件被复制到本地系统中
将HDFS中的test文件复制到本地系统并命名为getin:
hadoop fs -get /test ~/getin
(4) 删除文档
删除HDFS下名为out的文档:
hadoop fs -rm -r -f /out
(5) 查看文件
查看HDFS下test文件中的内容:
hadoop fs -cat /datas/test/*
(6) 建立目录
hadoop fs -mkdir -p /user/hadoop/test

大数据Hadoop系列之HDFS命令讲解相关推荐

  1. Thinking in BigData(八)大数据Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解

          纯干货:Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解. 通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS.MapReduce.Hbase.H ...

  2. 大数据基础系列 5:Hadoop 实验——熟悉常用的 HDFS 目录操作和文件操作

    文章目录 前言 一.实验目的 二.实验平台 三.实验内容和要求 3.1.HDFS 目录操作 3.1.1.创建用户目录 3.1.2.显示 HDFS 中与当前用户对应的目录内容 3.1.3.列出 HDFS ...

  3. 大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 图文详解

    引言 在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...

  4. 2021年大数据Hadoop(十四):HDFS的高可用机制

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 HDFS的高可用机制 HDFS高可用介绍 组件介绍 Nam ...

  5. 大数据基础系列 4:伪分布式 Hadoop 在 Ubuntu 上的安装流程完整步骤及易错点分析

    文章目录 前言 一.创建 Ubuntu 用户 二.安装 Java 2.1.查看本地 Java 版本 2.2.验证 Java 在本地的配置情况 三.安装 ssh 服务 3.1.安装 openssh-se ...

  6. 王家林 云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程:通过HDFS的心跳来测试replication具体的工作机制和流程...

    这一讲主要深入使用HDFS命令行工具操作Hadoop分布式集群,主要是通过实验的配置hdfs-site.xml文件的心跳来测试replication具体的工作和流程. 通过HDFS的心跳来测试repl ...

  7. 大数据小白系列——HDFS(1)

    [注1:结尾有大福利!] [注2:想写一个大数据小白系列,介绍大数据生态系统中的主要成员,理解其原理,明白其用途,万一有用呢,对不对.] 大数据是什么?抛开那些高大上但笼统的说法,其实大数据说的是两件 ...

  8. 大数据Hadoop之——Hadoop HDFS多目录磁盘扩展与数据平衡实战操作

    文章目录 一.概述 二.Hadoop DataNode多目录磁盘配置 1)配置hdfs-site.xml 2)配置详解 1. dfs.datanode.data.dir 2.dfs.datanode. ...

  9. Python +大数据-hadoop生态-hadoop(三)--Hadoop HDFS

    Python +大数据-hadoop生态-hadoop(三)–Hadoop HDFS 今日课程学习目标 理解分布式文件存储的概念与实现 掌握HDFS分块存储.副本机制等特性 学会shell操作HDFS ...

最新文章

  1. 在 Linux 中用Seahorse管理你的密码和加密密钥
  2. git 还原版本方法
  3. mootools1.3.1源码解读
  4. 架构语言ArchiMate -业务层(Business Layer)
  5. 使用四种框架分别实现百万websocket常连接的服务器--转
  6. axios基础和封装
  7. [SAP-SD]Sales Order 中的User Exit开发
  8. RFC Destination WORKFLOW_LOCAL_001 - User WF-BATCH
  9. 巨量引擎短视频广告价值白皮书
  10. php默认字体是什么,在word中系统默认的中文字体和字号是什么,word默认字体
  11. 【java】序列化:ProtoBuf 与 JSON 的比较
  12. vue ---- vue简介
  13. selenium脚本编写的注意点,那些我踩过的坑
  14. VUE之命令行报错:Component template should contain exactly one root element. If you are using v-if on multi
  15. 使用BetterZip结合自动操作工具和预设设置创建电影解压程序
  16. scheme 微博_可用App URL Schemes
  17. IE浏览器打不开网页有什么解决的方法
  18. miui中的网页链接调用服务器,miui新增网页链接调用服务有什么用?
  19. 计算机专业学生参加igem,喜讯:深圳大学iGEM团队再获金奖,并获得最佳单项奖,为今年大中华地区iGEM参赛队伍最佳成绩!-深圳大学生命与海洋科学学院...
  20. [生存志] 第6节 第一篇 以史为鉴 明朝事的读后心得

热门文章

  1. 史上最详细的RACI(责任分配矩阵)使用方法及实例详解
  2. 软考-高级项目管理(二十)
  3. U盘、移动硬盘错误0x80071ac3!
  4. Python各版本安装包下载
  5. 如何基于用户生命周期分析,寻找新的增长点
  6. Vue整合ElementUI
  7. PyTorch数据归一化处理:transforms.Normalize及计算图像数据集的均值和方差
  8. 全国人工智能师资培训班·上海站火热招生中
  9. XX健康:预约管理-套餐管理图片上传与预览Redis实现定时清理垃圾图片
  10. react引入svg图片