MR程序的几种提交运行模式

本地模型运行

1/在windows的eclipse里面直接运行main方法,就会将job提交给本地执行器localjobrunner执行

----配置path:D:\hadoop-2.7.2\bin

----配置hadoop_home:D:\hadoop-2.7.2

----复制 hadoop.dll和winutils.exe 到hadoop/bin文件夹下

下载地址,注意版本:http://download.csdn.net/detail/u014310430/8402965

----输入输出数据可以放在本地路径下(c:/wc/srcdata/)
      ----输入输出数据也可以放在hdfs中(hdfs://hello110:9000/wc/srcdata)
      
      
2/在linux的eclipse里面直接运行main方法,但是不要添加yarn相关的配置,也会提交给localjobrunner执行
      ----输入输出数据可以放在本地路径下(/home/hadoop/wc/srcdata/)
      ----输入输出数据也可以放在hdfs中(hdfs://hello110:9000/wc/srcdata)

集群模式运行

1【推荐的方法】/将工程打成jar包,上传到服务器,然后用hadoop命令提交  hadoop jar wc.jar cn.itcast.hadoop.mr.wordcount.WCRunner

http://blog.csdn.net/zengmingen/article/details/51152001

2/在linux的eclipse中直接运行main方法,也可以提交到集群中去运行,但是,必须采取以下措施:
      ----在工程src目录下加入 mapred-site.xml  和  yarn-site.xml 
      ----将工程打成jar包(wc.jar),同时在main方法中添加一个conf的配置参数 conf.set("mapreduce.job.jar","wc.jar");

3/在windows的eclipse中直接运行main方法,也可以提交给集群中运行,但是因为平台不兼容,需要做很多的设置修改

----要在windows中存放一份hadoop的安装包(解压好的)
----要将其中的lib和bin目录替换成根据你的windows版本重新编译出的文件
----再要配置系统环境变量 HADOOP_HOME  和 PATH
----修改YarnRunner这个类的源码

MR程序的几种提交运行模式相关推荐

  1. Hadoop系列(三)MapReduce Job的几种提交运行模式

    Job执行可以分为本地执行或者集群执行.hadoop集群安装部署在远程centos系统中.使用经典的WordCount代码为例. 1. 本地执行模式(本地为MacOS环境),无需启动远程的hadoop ...

  2. hadoop大数据——mapreduce程序提交运行模式及debug方法

    本地运行模式 (1)mapreduce程序是被提交给LocalJobRunner在本地运行 (2)而处理的数据及输出结果可以在本地文件系统,也可以在hdfs上 怎样实现本地运行?:写一个程序,不要带集 ...

  3. Windows下Eclipse提交MR程序到HadoopCluster

    作者:Syn良子 出处:http://www.cnblogs.com/cssdongl 欢迎转载,转载请注明出处. 以前Eclipse上写好的MapReduce项目经常是打好包上传到Hadoop测试集 ...

  4. gRPC 的 4 种基础通信模式

    题图 |  from freepik 本文将讨论 gRPC 应用程序的 4 种基础通信模式:一元 RPC.服务器端流 RPC.客户端流 RPC 以及双向流 RPC.在这个过程中,我们会使用一些真实用例 ...

  5. java dtu 采集程序_一种物联网用DTU数据采集方法与流程

    本发明涉及物联网的技术领域,特别是DTU数据采集的技术领域. 背景技术: 联网是一种新兴的概念,要实现物联网需要大量的数据进行支持,这就不可避免的需要对各种数据接收.发送.处理.现有的数据采集方式较为 ...

  6. spark的三种运行模式以及yarn-client和yarn-cluster在提交命令上的区别

    本文针对的是Spark 2.3.1 standalone:线下模式 分为standalone-client和standalone-cluster两种模式 yarn:线上模式 又分为yarn-clien ...

  7. matlab安装程序无法启动jvm_天呀!JVM居然还有2两种运行模式

    概述 JVM有两种运行模式Server与Client.两种模式的区别在于,Client模式启动速度较快,Server模式启动较慢:但是启动进入稳定期长期运行之后Server模式的程序运行速度比Clie ...

  8. spark sql 本地调试_Spark精华问答|Spark的三种运行模式有何区别?

    戳蓝字"CSDN云计算"关注我们哦! Spark是一个针对超大数据集合的低延迟的集群分布式计算系统,比MapReducer快40倍左右,是hadoop的升级版本,Hadoop作为第 ...

  9. Spark精华问答 | Spark的三种运行模式有何区别?

    戳蓝字"CSDN云计算"关注我们哦! Spark是一个针对超大数据集合的低延迟的集群分布式计算系统,比MapReducer快40倍左右,是hadoop的升级版本,Hadoop作为第 ...

最新文章

  1. 2020年,最适合AI的5种编程语言
  2. NR 5G 安全要求和功能
  3. python编程入门课程视频-带学《Python编程:从入门到实践》
  4. Golang中支持可变参数
  5. SqlServer自定义排序
  6. python使用xlrd读取xlsx文件_$ 用python处理Excel文档(1)——用xlrd模块读取xls/xlsx文档...
  7. 软件测试工程师-Python语言
  8. 中国计算机学会推出 CSP 非专业级别认证
  9. 华为云welink成像是反的_华为云Welink下载_华为云Welink 中文版 v6.6.6.0_Win10镜像官网...
  10. 正反观点验证2010年10大安全挑战
  11. videojs 动态加载视频
  12. 手机模板区块(HTML、CSS)
  13. win10关闭windows聚焦_关于Windows 10 Windows聚焦功能失效
  14. 怎么用美图秀秀制作证件照
  15. 求解一元二次方程c语言程序,一元二次方程求解程序完整代码
  16. 无限滚动新一代老虎机
  17. 应用测试一(烤地瓜)——> 隐藏数据
  18. 【win11远程桌面访问--基于云端服务器(腾讯云为例)frp的内网穿透实现】
  19. 第七十二章 Caché 函数大全 $WISWIDE 函数
  20. 电脑显示U盘,但是读取不了

热门文章

  1. mysql-5.5.56配置_mysql 5.5.56免安装版配置方法
  2. full gc JAVA_java触发full gc的几种情况概述
  3. redis分布式锁小试
  4. git revert和reset区别
  5. c语言程序中return的作用,单片机C语言程序中return dat 什么意思
  6. 蓝牙耳机声音一顿一顿的_线控耳机党阵地转移成功,OPPO这款TWS耳机体验满分...
  7. (2021) 24 [持久化] 文件系统API
  8. 已知a类被打包在packagea_2021考研干货:199管理类联考综合逻辑归纳习题(1)
  9. linux中的码字软件,码字写作软件下载
  10. python3.6.2用pyinstaller3.4报错_OceanBase 2.2 版本体验:用 BenchmarkSQL 跑 TPC-C