MapReduce 数字统计例子WordCount

在单机环境上运行WordCount.java程序

简单配置为:/etc/hosts:

Core-site.xml

在这两个配置文件下运行WordCount 程序,出现如下的错误:

错误中有一句:due to :Call From YARN001/127.0.0.1 to YARN001:8020 failed,所以经过不断地尝试,将core-site.xml里的hdfs://YARN001:8020改为hdfs://192.168.116.50:8020后程序运行成功:

回过头审视,发现/etc/hosts配置得形同虚设于是将/etc/hosts最后一行删去

用到的HDFS基本命令有

bin/hdfs dfs -rmr /output

bin/hdfs dfs -mkdir -p /input

bin/hdfs dfs -put WordCout.java /input

其他基本命令,记录到博客中

执行wordcount程序命令为:

bin/hadoop jar /home/dongwengao/wordcount.jar wordcount/WordCount /input /output

说明:wordcount/WordCount是包名/类名, /input输入目录为args[0],需要提前生成, /output 输出目录为args[1],不能提前生成,如果生成要删除。

转载于:https://www.cnblogs.com/hotMemo/p/9338415.html

MapReduce执行WordCount操作相关推荐

  1. 初学Hadoop之图解MapReduce与WordCount示例分析

    Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算. HDFS是Google File System(GFS) ...

  2. Hadoop学习记录(4)|MapReduce原理|API操作使用

    MapReduce概念 MapReduce是一种分布式计算模型,由谷歌提出,主要用于搜索领域,解决海量数据计算问题. MR由两个阶段组成:Map和Reduce,用户只需要实现map()和reduce( ...

  3. 从搭建大数据环境说起,到执行WordCount所遇到的坑

    从搭建大数据环境说起,到执行WordCount所遇到的坑 文章目录 从搭建大数据环境说起,到执行WordCount所遇到的坑 背景说明 基于`docker compose`的大数据环境搭建 docke ...

  4. 第一个MapReduce程序-------WordCount

    本关任务 词频统计是最能体现MapReduce思想的程序,结构简单,上手容易. 词频统计的大致功能是:统计单个或者多个文本文件中每个单词出现的次数,并将每个单词及其出现频率按照<k,v>键 ...

  5. 【Big Data - Hadoop - MapReduce】初学Hadoop之图解MapReduce与WordCount示例分析

    Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算. HDFS是Google File System(GFS) ...

  6. Hadoop之图解MapReduce与WordCount示例分析

    Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算. HDFS是Google File System(GFS) ...

  7. MapReduce入门(一)—— MapReduce概述 + WordCount案例实操

    MapReduce入门(一)-- MapReduce概述 文章目录 MapReduce入门(一)-- MapReduce概述 1.1 MapReduce 定义 1.2 MapReduce 优缺点 1. ...

  8. WordCount操作步骤

    WordCount操作步骤 启动Hadoop,注意!启动前需要格式化文件系统!启动后执行jps的结果进程应至少包含一个NameNode,一个DataNode,一个SecondaryNameNode 创 ...

  9. mapreduce实现wordcount 详细解析

    总括 Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算. HDFS是Google File System(G ...

最新文章

  1. java语言 文件上传,java中实现文件上传的方法
  2. 杭电ACM刷题(1):1002,A + B Problem II
  3. JavaScript实现regular-expression-matching正则表达式匹配算法(附完整源码)
  4. 棋牌游戏服务器架构: 详细设计(三) 数据库设计
  5. HTML5前端知识分享:Vue入门
  6. 大数据_Hbase-分布式介绍_分布式发展历程_去中心化_客户端负载均衡_服务器端负载均衡---Hbase工作笔记0001
  7. 转载:给自己一个警示
  8. 【CCNA考试】2010-05-24-武汉-872(PASS)
  9. Windows Phone 项目实战之我的微盘
  10. java的class文件反编译
  11. 朴素贝叶斯python实现预测_Python朴素贝叶斯预测.PDF
  12. 开发与测试的相爱相杀
  13. Yii2.0 获取当前url和域名
  14. 微信公众号-网页内实现微信支付
  15. BIGO前端一面面经
  16. Linux 下的桌面指针时钟
  17. struct tm 和 time_t 时间和日期的使用方法
  18. 【Java书笔记】:《Redis 深度历险:核心原理和应用实践》分布式锁,延时队列,位图,HyperLogLog,布隆过滤器,漏斗限流,GeoHash,Scan,管道,事务,主从,Redis源码
  19. crypto-js 加密解密 (TS版本)
  20. linux系统可以安装浩辰CAD,浩辰CAD Linux下载

热门文章

  1. 使用ABAP(ADBC)和Java(JDBC)连接SAP HANA数据库 1
  2. S/4HANA for Customer Management里的搜索分页处理 1
  3. win7功能找不到信息服务器,win7系统找不到Internet信息服务的解决方法
  4. search.php制作,重写搜索Search类
  5. java byte转换成string_Java byte []到/从String转换
  6. 他不怕被拒绝_【保险知识】高情商保险营销,再也不怕被拒绝!
  7. rar x64 5.50 linux,WinRAR 5.50 简体中文正式版发布
  8. 联想昭阳k29轴拆机步骤图_UG8.5编程加工之固定轴曲面轮廓铣削加工方法
  9. hexo评论_Hexo系列 | Hexo的基本使用
  10. 安卓最新系统_安卓最新10.0系统,新增功能都在这了!