MapReduce执行WordCount操作
MapReduce 数字统计例子WordCount
在单机环境上运行WordCount.java程序
简单配置为:/etc/hosts:
Core-site.xml
在这两个配置文件下运行WordCount 程序,出现如下的错误:
错误中有一句:due to :Call From YARN001/127.0.0.1 to YARN001:8020 failed,所以经过不断地尝试,将core-site.xml里的hdfs://YARN001:8020改为hdfs://192.168.116.50:8020后程序运行成功:
回过头审视,发现/etc/hosts配置得形同虚设于是将/etc/hosts最后一行删去
用到的HDFS基本命令有
bin/hdfs dfs -rmr /output
bin/hdfs dfs -mkdir -p /input
bin/hdfs dfs -put WordCout.java /input
其他基本命令,记录到博客中
执行wordcount程序命令为:
bin/hadoop jar /home/dongwengao/wordcount.jar wordcount/WordCount /input /output
说明:wordcount/WordCount是包名/类名, /input输入目录为args[0],需要提前生成, /output 输出目录为args[1],不能提前生成,如果生成要删除。
转载于:https://www.cnblogs.com/hotMemo/p/9338415.html
MapReduce执行WordCount操作相关推荐
- 初学Hadoop之图解MapReduce与WordCount示例分析
Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算. HDFS是Google File System(GFS) ...
- Hadoop学习记录(4)|MapReduce原理|API操作使用
MapReduce概念 MapReduce是一种分布式计算模型,由谷歌提出,主要用于搜索领域,解决海量数据计算问题. MR由两个阶段组成:Map和Reduce,用户只需要实现map()和reduce( ...
- 从搭建大数据环境说起,到执行WordCount所遇到的坑
从搭建大数据环境说起,到执行WordCount所遇到的坑 文章目录 从搭建大数据环境说起,到执行WordCount所遇到的坑 背景说明 基于`docker compose`的大数据环境搭建 docke ...
- 第一个MapReduce程序-------WordCount
本关任务 词频统计是最能体现MapReduce思想的程序,结构简单,上手容易. 词频统计的大致功能是:统计单个或者多个文本文件中每个单词出现的次数,并将每个单词及其出现频率按照<k,v>键 ...
- 【Big Data - Hadoop - MapReduce】初学Hadoop之图解MapReduce与WordCount示例分析
Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算. HDFS是Google File System(GFS) ...
- Hadoop之图解MapReduce与WordCount示例分析
Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算. HDFS是Google File System(GFS) ...
- MapReduce入门(一)—— MapReduce概述 + WordCount案例实操
MapReduce入门(一)-- MapReduce概述 文章目录 MapReduce入门(一)-- MapReduce概述 1.1 MapReduce 定义 1.2 MapReduce 优缺点 1. ...
- WordCount操作步骤
WordCount操作步骤 启动Hadoop,注意!启动前需要格式化文件系统!启动后执行jps的结果进程应至少包含一个NameNode,一个DataNode,一个SecondaryNameNode 创 ...
- mapreduce实现wordcount 详细解析
总括 Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算. HDFS是Google File System(G ...
最新文章
- java语言 文件上传,java中实现文件上传的方法
- 杭电ACM刷题(1):1002,A + B Problem II
- JavaScript实现regular-expression-matching正则表达式匹配算法(附完整源码)
- 棋牌游戏服务器架构: 详细设计(三) 数据库设计
- HTML5前端知识分享:Vue入门
- 大数据_Hbase-分布式介绍_分布式发展历程_去中心化_客户端负载均衡_服务器端负载均衡---Hbase工作笔记0001
- 转载:给自己一个警示
- 【CCNA考试】2010-05-24-武汉-872(PASS)
- Windows Phone 项目实战之我的微盘
- java的class文件反编译
- 朴素贝叶斯python实现预测_Python朴素贝叶斯预测.PDF
- 开发与测试的相爱相杀
- Yii2.0 获取当前url和域名
- 微信公众号-网页内实现微信支付
- BIGO前端一面面经
- Linux 下的桌面指针时钟
- struct tm 和 time_t 时间和日期的使用方法
- 【Java书笔记】:《Redis 深度历险:核心原理和应用实践》分布式锁,延时队列,位图,HyperLogLog,布隆过滤器,漏斗限流,GeoHash,Scan,管道,事务,主从,Redis源码
- crypto-js 加密解密 (TS版本)
- linux系统可以安装浩辰CAD,浩辰CAD Linux下载
热门文章
- 使用ABAP(ADBC)和Java(JDBC)连接SAP HANA数据库 1
- S/4HANA for Customer Management里的搜索分页处理 1
- win7功能找不到信息服务器,win7系统找不到Internet信息服务的解决方法
- search.php制作,重写搜索Search类
- java byte转换成string_Java byte []到/从String转换
- 他不怕被拒绝_【保险知识】高情商保险营销,再也不怕被拒绝!
- rar x64 5.50 linux,WinRAR 5.50 简体中文正式版发布
- 联想昭阳k29轴拆机步骤图_UG8.5编程加工之固定轴曲面轮廓铣削加工方法
- hexo评论_Hexo系列 | Hexo的基本使用
- 安卓最新系统_安卓最新10.0系统,新增功能都在这了!