本文为在校学习大数据课程期间,对厦门大学林子雨老师大数据技术原理与应用 第三章 分布式文件系统HDFS学习指南一文进行的整理,方便自己学习查看
原文地址为大数据技术原理与应用 第三章 分布式文件系统HDFS学习指南
操作系统为Ubuntu16.04
虚拟机为VirtualBox

一、HDFS文件操作

启动Hadoop

cd /usr/local/hadoop
./sbin/start-dfs.sh #启动hadoop

1.shell命令与HDFS交互

1.1目录操作

第一次使用HDFS时,需要首先在HDFS中创建用户目录。

cd /usr/local/hadoop
./bin/hdfs dfs –mkdir –p /user/hadoop

列出HDFS上所有目录

./bin/hdfs dfs –ls

创建一个input目录

 ./bin/hdfs dfs –mkdir input #相对路径,完整路径为“/user/hadoop/input”

1.2文件操作

使用vim在本地Linux系统“/home/hadoop/”目录下创建一个文件myLocalFile.txt

Hadoop
Spark
XMU DBLAB

本地文件系统的“/home/hadoop/myLocalFile.txt”上传到HDFS中的当前用户目录的input目录

./bin/hdfs dfs -put /home/hadoop/myLocalFile.txt  input

查看HDFS中input目录下文件

./bin/hdfs dfs –ls input
Found 1 items
-rw-r--r--   1 hadoop supergroup         36 2022-03-18 10:47 input/ myLocalFile.txt

查看HDFS中myLocalFile.txt这个文件的内容

./bin/hdfs dfs –cat input/myLocalFile.txt

HDFS中myLocalFile.txt文件下载到本地文件系统中的“/home/hadoop/下载/”目录

./bin/hdfs dfs -get input/myLocalFile.txt  /home/hadoop/下载

HDFS中文件从一个目录拷贝到另一个目录中,如将“/user/hadoop/input/myLocalFile.txt”文件,拷贝到HDFS的另外一个目录“/user/hadoop/input01/”中

./bin/hdfs dfs -cp input/myLocalFile.txt  input01

2.运行程序部署

将IDE中java文件打jar包至Linux中/usr/local/hadoop/myapp目录下(jar包导出操作详见置顶原文)

使用hadoop jar命令运行程序

cd /usr/local/hadoop
./bin/hadoop jar ./myapp/HDFSExample.jar
#或者
cd /usr/local/hadoop
java -jar ./myapp/HDFSExample.jar

大数据上机基础—HDFS文件操作相关推荐

  1. hdfs mv命令_大数据入门:HDFS文件管理系统简介

    Hadoop作为大数据主流的基础架构选择,至今仍然占据着重要的地位,而基于Hadoop的分布式文件系统HDFS,也在大数据存储环节发挥着重要的支撑作用.今天的大数据入门分享,我们就主要来讲讲HDFS分 ...

  2. 大数据技术基础实验三:HDFS实验——部署HDFS

    大数据技术基础实验三:HDFS实验--部署HDFS 文章目录 大数据技术基础实验三:HDFS实验--部署HDFS 一.前言 二.实验要求 三.实验原理 1.什么是HDFS? 2.HDFS的体系结构 3 ...

  3. Hadoop大数据零基础高端实战培训系列配文本挖掘项目

    <Hadoop大数据零基础高端实战培训系列配文本挖掘项目(七大亮点.十大目标)> 课程讲师:迪伦 课程分类:大数据 适合人群:初级 课时数量:230课时 用到技术:部署Hadoop集群 涉 ...

  4. 大数据入门基础系列之初步认识大数据生态系统圈(博主推荐)

    不多说,直接上干货! 之前在微信公众平台里写过 大数据入门基础系列之初步认识hadoop生态系统圈 http://mp.weixin.qq.com/s/KE09U5AbFnEdwht44FGrOA 大 ...

  5. python大数据零基础_零基础学习大数据人工智能,学习路线篇!

    大数据处理技术怎么学习呢?首先我们要学习Python语言和Linux操作系统,这两个是学习大数据的基础,学习的顺序不分前后. Python:Python 的排名从去年开始就借助人工智能持续上升,现在它 ...

  6. [大数据计算基础] 大数据计算系统

    大数据计算系统 大数据计算框架的几个要素 : • 计算场景: 适用于何种任务使用? • 抽象:程序员看到的框架是什么样的? • API:程序员如何使用框架? • 系统架构:系统有哪些模块? • 基本数 ...

  7. 大数据入门培训之大数据开发基础知识学习

    在目前相信大多数IT开发人员对于人工智能+大数据并不陌生,使用的场景也越来越广,日常开发中前端同学也逐渐接触了更多与大数据相关的开发需求.因此对大数据知识也有必要进行一些学习理解,带大家来学习了解一下 ...

  8. Hadoop大数据零基础高端实战培训系列课程分享

     第一阶段:Hadoop基础篇(50课时) - 千里之行,始于足下(赠送课程) 课程一.基于Linux操作系统平台下的Java语言开发(20课时) 本套课程主要介绍了Linux系统下的Java环境 ...

  9. 大数据开发:分布式文件存储系统简介

    在分布式存储技术体系当中,分布式文件存储是其中的分类之一,也是大数据架构当中常常用到的.得益于Hadoop的高人气,Hadoop原生的HDFS分布式文件系统,也广泛为人所知.但是分布式文件存储系统,并 ...

最新文章

  1. wordpress主题
  2. 少儿编程语言python-青少儿编程语言Python的学习紧迫性
  3. String str =new String(“abc“)和 String str = “abc“的比较
  4. springboot-静态资源配置原理
  5. 混合云存储开启企业上云新路径--阿里云混合云备份容灾方案发布 1
  6. Similar Pairs CodeForces - 1360C(图匹配+简单贪心)
  7. HashSet源码分析:JDK源码系列
  8. java 补丁差异_差异和补丁简介
  9. Assembly generation failed Referenced assembly ‘xxx’ does not have a strong name
  10. 学习笔记大型《构建高性能web站点》
  11. Oracle GoldenGate Director安装和配置(无图)
  12. bzoj 2705: [SDOI2012]Longge的问题(欧拉函数)
  13. 三面头条,靠P9级算法分享的两本算法pdf书籍,轻松拿到offer
  14. 手游反抗战兴起,《原神》打响“起义“第一枪
  15. SQL2008 安装需要重启计算机
  16. 猪齿鱼2.0版本发布,解锁更多新特性,提升研发管理效率
  17. 联想A790E的root方法
  18. windows10获取超级管理员权限
  19. 阿里云服务器mysql数据库读写权限设置_MySQL权限管理
  20. Python:Excel自动化实践入门篇 甲【留言点赞领图书门票】

热门文章

  1. 研发人员如何做绩效考核
  2. 2004全国城市GDP排名(前40名)
  3. linux时间同步命令shell,LINUX时间同步脚本或命令
  4. AutoCAD2009下载AutoCAD2009中文版安装教程附软件下载
  5. 2012美国大选献金项目数据分析
  6. 美国大选献金项目学习笔记
  7. android 线性布局竖线,3.2.1 线性布局(1)
  8. Could not download lifecycle-service.aar (androidx.lifecycle:lifecycle-service:2.0.0)
  9. 如何写创业计划书[转]
  10. centos6无法识别因特尔I210网卡