2019独角兽企业重金招聘Python工程师标准>>>

测试HDFS

上传文件到hdfs hadoop分布式文件系统

hadoop fs -put /opt/jdk.gz hdfs://master:9000/jdk

5/22/2017------------------------

17/05/21 22:55:06 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
put: Cannot create file/jdk._COPYING_. Name node is in safe mode.
忽略第一行错误,看第二行,是由于系统空间不足

df -hl命令查看系统空间使用情况

删除一些文件后,正常执行上传文件

5/22/2017------------------------

下载到linux文件系统

hadoop fs -get hdfs://master:9000/jdk /opt/jdk2

查看文件列表

hadoop fs -ls

例子-wordcount

上传包含各种单词的word文件到hdfs,然后执行以下命令,可以得到结果文件word-out

hadoop jar hadoop-mapreduce-examples-2.6.0.jar wordcount hdfs://master:9000/word  hdfs://master:9000/word-out

默认在hdfs文件系统底下,所以也可以简写成以下

hadoop jar hadoop-mapreduce-examples-2.6.0.jar wordcount /word  word-out-2

转载于:https://my.oschina.net/jayronwang/blog/393811

Hadoop tutorial - 3 Hello MapReduce- 2015-3-30相关推荐

  1. hadoop详细笔记(十一) mapreduce数据分析案例之线段重叠案例

    1 数据 1,4 2,5 3,4 2,5 2,4 3,4 2,6 2 需求 统计x轴上每个点线段重叠的次数 3 代码实现 package com._51doit.mr.line;import org. ...

  2. 大数据基础之Hadoop(三)—— MapReduce

    作者:duktig 博客:https://duktig.cn (文章首发) 优秀还努力.愿你付出甘之如饴,所得归于欢喜. 本篇文章源码参看:https://github.com/duktig666/b ...

  3. Hadoop实验4:MapReduce编程

    目录 一. [实验准备] 1.工作目录 2.打开eclipse并配置工作空间 二.准备工作 1. 新建项目 2. 准备测试数据 3. 添加 MapReduce 编程框架 三.Map过程 四.Reduc ...

  4. Hadoop 中文编码相关问题 -- mapreduce程序处理GBK编码数据并输出GBK编码数据

    2019独角兽企业重金招聘Python工程师标准>>> Hadoop 中文编码相关问题 -- mapreduce程序处理GBK编码数据并输出GBK编码数据 输入是GBK文件, 输出也 ...

  5. python部署到hadoop上_python实现mapreduce(2)——在hadoop中执行

    目的:将python实现mapreduce(1)中的python脚本部署到hadoop上,实现mapreduce. 1. 修改脚本执行权限 [tianyc@TeletekHbase ~]$ which ...

  6. Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解

    编者按:HDFS和MapReduce是Hadoop的两大核心,除此之外Hbase.Hive这两个核心工具也随着Hadoop发展变得越来越重要.本文作者张震的博文<Thinking in BigD ...

  7. Hadoop学习笔记—11.MapReduce中的排序和分组

    Hadoop学习笔记-11.MapReduce中的排序和分组 一.写在之前的 1.1 回顾Map阶段四大步骤 首先,我们回顾一下在MapReduce中,排序和分组在哪里被执行: 从上图中可以清楚地看出 ...

  8. Hadoop入门(十二)Intellij IDEA远程向hadoop集群提交mapreduce作业

    Intellij IDEA远程向hadoop集群提交mapreduce作业,需要依赖到hadoop的库,hadoop集群的配置信息,还有本地项目的jar包. 一.软件环境 (1)window本地安装h ...

  9. Hadoop 生态系列之 Mapreduce

    阅读文本大概需要 5 分钟.文章稍长,建议收藏慢慢看. 目前 Hadoop 系列文章的规划就是这样,持续补充完善中- 同时可以访问 https://data.cuteximi.com Hadoop 生 ...

  10. Hadoop实战系列之MapReduce 分析 Youtube视频数据

    Hadoop实战系列之MapReduce 分析 Youtube视频数据 一.实战介绍 MapReduce 是 Hadoop 的计算框架. 在运行一个 MR 程序时,任务过程被分为两个阶段:Map 阶段 ...

最新文章

  1. 【LeetCode】004 Median of Two Sorted Arrays 两个排序数组合并后的中位数
  2. OPenGL中的缓冲区对象
  3. org.apache.hadoop.hbase.PleaseHoldException: Master is initializing(解決方案汇总+自己摸索)
  4. Kubernetes探索学习005--Kubernetes的Controller模型和ReplicaSet伸缩
  5. BugkuCTF-WEB题速度要快
  6. 想提高运维效率,那就把MySQL数据库部署到Kubernetes 集群中
  7. python 邮箱验证_Python-发送邮件验证码
  8. 【iCore4 双核心板_uC/OS-II】例程一:认识 uC/OS-II
  9. JSP 内置对象request常见用法
  10. 一个好看的CSS样式表格
  11. android手机的屏幕录制在哪里,手机屏幕录制在哪里,安卓手机视频录制软件分享...
  12. 学会忘记其实是一种美德
  13. win10删除U盘分区
  14. Arduino基础2
  15. FPGA时序分析和时序约束
  16. 动手开发一个滴滴出行,是的,你没有看错!
  17. 从 三江方士 的 中华级数 想到 数学的界限
  18. 素描嘴巴注意这几个点,轻松画出头像神韵~
  19. 向量数据库极简教程 | A Gentle Introduction to Vector Databases
  20. 怎么测试视频是哪个软件拍的,李子柒的视频是用什么设备拍摄的,又是用什么软件处理的?...

热门文章

  1. 信签纸有虚线怎么写_edm邮件营销,专注解决你的开发信难题
  2. java序列化原理_Java序列化机制和原理
  3. 2层框架结构柱子间距_3分钟牢记框架结构要点
  4. canvas 从入门到入坟
  5. zimbra mysql管理_zimbra 命令行管理
  6. c访问mysql数据库_C语言访问MySQL数据库的方法
  7. visio2013复制到word有多余白边_Visio虚线复制到word中变为实线的解决办法
  8. python到底是啥_Python语言中的__init__到底是干什么的?
  9. android聊天界面对话气泡_你在和脚本谈恋爱(自动化在IM聊天中的应用)
  10. 20190911:(leetcode习题)计数质数