本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.3.5节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3.5 动手实践:运行MapReduce任务

实验步骤如下:
1)上传/root/anaconda-ks.cfg文件到HDFS文件系统/user/root目录;
2)使用yarn jar的方式提交任务,其中,

  • jar文件:$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar
  • 主类为:wordcount
  • 输入参数:/user/root/anaconda-ks.cfg
  • 输出参数:/user/root/wc_00
    3)查看输出运行结果;

4)使用mapred job命令查看任务状态及对应日志输出;
5)再次执行任务,查看输出信息;
6)产生一个大数据文件,上传到HDFS,使用该大数据文件执行单词计数MapReduce任务,在执行到一半后,使用mapred job的kill命令,杀死该任务,查看相关输出信息。
思考:
1)执行第5步的时候会报错吗?报什么错?怎么解决?
2)可以在Hadoop IDE中直接提交Job吗?如果可以怎么做?如果不可以,为什么?

《Hadoop与大数据挖掘》一2.3.5 动手实践:运行MapReduce任务相关推荐

  1. 《Hadoop与大数据挖掘》——2.6 TF-IDF算法原理及Hadoop MapReduce实现

    本节书摘来自华章计算机<Hadoop与大数据挖掘>一书中的第2章,第2.6节,作者 张良均 樊哲 位文超 刘名军 许国杰 周龙 焦正升,更多章节内容可以访问云栖社区"华章计算机& ...

  2. 分享Hadoop处理大数据工具及优势

    现如今,随着云计算技术.物联网技术的兴起,企业需要应对的数据规模越来越大.数据格式越来越复杂.数据收集速度越来越快,也使得它和传统意义的业务数据相比,有了明显的特点.比如ApacheHadoop已成为 ...

  3. 决胜大数据时代:HadoopYarnSpark企业级最佳实践(3天)

    Hadoop是云计算的事实标准软件框架,是云计算理念.机制和商业化的具体实现,是整个云计算技术学习中公认的核心和最具有价值内容. Yarn是目前公认的最佳的分布式集群资源管理框架: Mahout是目前 ...

  4. 基于Hadoop/Mahout/Mllib的大数据挖掘培训开课

    3月16日,由培训中心举办的"大数据分析挖掘-基于Hadoop/Mahout/MLlib的大数据挖掘"在北京厦门大厦开课.20位来自政府机关,金融保险.移动和互联网等大数据来源单位 ...

  5. 基于Hadoop的大数据平台实施记——整体架构设计[转]

    http://blog.csdn.net/jacktan/article/details/9200979 大数据的热度在持续的升温,继云计算之后大数据成为又一大众所追捧的新星.我们暂不去讨论大数据到底 ...

  6. 荐六十款针对Hadoop和大数据顶级开源工具

    为什么80%的码农都做不了架构师?>>>    荐六十款针对Hadoop和大数据顶级开源工具 2015-08-10 10:37 布加迪编译 51CTO 字号: T |  T 说到处理 ...

  7. 混凝土泵送机械大数据挖掘与应用

    混凝土泵送机械大数据挖掘与应用 赵鑫, 吴德志, 周志忠 中联重科股份有限公司,湖南 长沙 410205 国家混凝土机械工程技术研究中心,湖南 长沙 410205 摘要:基于混凝土机械设备的施工数据. ...

  8. 2015年《大数据》高被引论文Top10文章No.2——大数据时代的数据挖掘 —— 从应用的角度看大数据挖掘(下)...

    2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.2, ...

  9. 2015年《大数据》高被引论文Top10文章No.2——大数据时代的数据挖掘 —— 从应用的角度看大数据挖掘(上)...

    2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.2, ...

最新文章

  1. 直播回顾|基于格雷码结合相移技术的高鲁棒性高效率动态三维面形测量
  2. 一文读懂比特币UXTO,TA其实没那么神秘!
  3. 每一个人都是平凡的英雄
  4. rsync 端口更换(默认873)
  5. java虚拟机监控_Java虚拟机监控工具
  6. jcache_窥探JCache API(JSR 107)
  7. php如果字符串有1 3 5,Day3-php 字符串1
  8. 用VMware GSX和W2K群集服务实现Exchange群集
  9. .NET设计模式系列文章 [原]
  10. Windows Server 2012正式版RDS系列⑻
  11. 什么新东西值得学「GitHub 热点速览 v.22.29」
  12. img文件制作linux启动u盘,用syslinux制作简单U盘启动盘教程
  13. 遭遇 kapjazy.dll,yhpri.dll,WinSys64.Sys,nwiztlbu.exe,myplayer.com 等2
  14. R语言混合效应(多水平/层次/嵌套)模型及贝叶斯实现
  15. 无光驱服务器操作系统安装系统吗,没有光驱的老机型如何安装操作系统。
  16. 华为模拟器eNSP - HCIP - OSPF的Totally STUB 、Totally NSSA综合实验
  17. 王者服务器为什么在5月20日维护,王者荣耀:5.20正式服平衡调整已上线,刘禅获加强,盾山迎来降温...
  18. 今晚直播 | 泰坦尼克号经典案例分析
  19. 计算机网络实验(华为eNSP模拟器)——第十一章 帧中继网络
  20. java思维导图源代码_如何使用思维导图解读java开源项目

热门文章

  1. ue4 导出模型_UE4构建光照后模型变黑,二套UV解决办法
  2. reeten lock java_Java多线程分析(八)----Syschronized VS ReentrankLock
  3. js页面跳转常用的几种方式
  4. 2fsk基于matlab的仿真,基于matlab的2ask、2psk、2fsk的仿真
  5. cad怎么画坐标系箭头_CAD绘图中箭头太大(小)怎么调整?
  6. i2c hid 触摸板不能用_I2C 总线协议初探 - STM32 I2C 接口外设学习笔记
  7. Java基础看jvm,JAVA基础知识|java虚拟机(JVM)
  8. 本机安装PaddlePaddle - 安装指南
  9. ESP8266访问网站-urequest get方法
  10. 斩草除根-修复被剪断的鼠标引线