job.waitForCompletion(true);进入源码
submit()-> connect();连接,客户端获取服务端的代理对象
connect()->new Cluster(getConfiguration());
Cluster(jobTrackAddr,conf)->initialize->clientProtocol RPC通信versionID
submit() ->submitter.submitJobInternal(Job.this, cluster):
checkSpecs(job);检查路径
copyAndConfigureFiles(job, submitJobDir);拷贝并且将文件写入到hfds
printTokens(jobId, job.getCredentials());
submitJob(jobId, submitJobDir.toString(), job.getCredentials())提交job
int maps = writeSplits(job, submitJobDir);job分割切片
writeSplits()-》maps = writeNewSplits(job, jobSubmitDir);-》 List splits = input.getSplits(job);//FileInputFormat获取切片
List getSplits(JobContext job)-》long minSize = Math.max(getFormatMinSplitSize(), getMinSplitSize(job));
getMinSplitSize(job)获取mapreduce.input.fileinputformat.split.minsize的值(hadoop-mapreduce-client-core-》mapred-default.xml)
List getSplits(JobContext job)-》long minSize 最终为1
List getSplits(JobContext job)-》long maxSize = getMaxSplitSize(job);-》在mapred-default.xml没有获取到值,得long的最大值
返切片文件列表splits

MapReduce源码分析_李孟_新浪博客相关推荐

  1. 2.2.2 胸腰差和胸臀差的应用_米人NOONE_新浪博客

    2.2.2 胸腰差和胸臀差的应用_米人NOONE_新浪博客 2.2.2  胸腰差和胸臀差的应用_米人NOONE_新浪博客 腰差和胸臀差的应用 (2009-06-16 19:24:57) 转载▼ 标签: ...

  2. v05.05 鸿蒙内核源码分析(任务管理) | 如何管理任务池 | 百篇博客分析HarmonyOS源码

    曾子曰:"吾日三省吾身:为人谋而不忠乎?与朋友交而不信乎?传不习乎?"<论语>:学而篇 百篇博客系列篇.本篇为: v05.xx 鸿蒙内核源码分析(任务管理篇) | 如何 ...

  3. ArcGIS MPK的两种打包方式_陈焜浩Arain_新浪博客

    最近发现用ArcGIS打包的MPK文件,如果数据的来源不一样:从shapefile源数据或者是从SDE源数据进行打包,能够引起打包文件的大小不一样已经在代码中引用文件的效率不一样的差异.开始发现这种差 ...

  4. MODIS MOD11A2地温产品_江仔91_新浪博客

    注意事项: 1.经MRT转换后的数据需要进一步处理,如:LST产品需经公式:NG*0.02-273.15运算后才可转换为设施温度.​

  5. 动画说明 李明杰新浪博客

    http://blog.csdn.net/liuting5521826/article/details/51121957 http://www.cnblogs.com/mjios/archive/20 ...

  6. MapReduce 源码分析(一)准备阶段

    MapReduce 源码分析 本篇博客根据wordCount代码进行分析底层源码的.以下称它为WC类. package com.henu;import org.apache.hadoop.conf.C ...

  7. 普度网络营销策划_普度网络营销策划-齐宁_新浪博客

    标签: 杂谈 自媒体的盛行,让我们知道了文案的重要性.一条好的文案,可以让你的广告如虎添翼.一篇好的内容可以瞬间刷爆朋友圈.今天我要总结的就是如何做一个打动人内心心智的好文案. 文案最主要的目的是让消 ...

  8. 邓文迪撑杆跳,甩开老公要独立?_富杂志_新浪博客

    邓文迪撑杆跳,甩开老公要独立?_富杂志_新浪博客 邓文迪撑杆跳,甩开老公要独立? (2010-01-11 10:55:22) 转载▼

  9. cadence spb 16.5 破解过程实例和使用感受_赤松子耶_新浪博客

    cadence spb 16.5 破解过程实例和使用感受_赤松子耶_新浪博客 Cadence Allegro16.5详细安装具体的步骤 1.下载SPB16.5下来后,点setup.exe,先安装第一项 ...

  10. 关于幂律分布的一个笔记_哈克_新浪博客

    关于幂律分布的一个笔记_哈克_新浪博客 关于幂律分布的一个笔记     (2011-03-02 18:12:27)     转载▼     标签:     幂律     二八法则     杂谈     ...

最新文章

  1. access汇总含义_2020最新大厂内部 PHP 高级工程师面试题汇总(二)
  2. 【Groovy】自定义 Xml 生成器 BuilderSupport ( 继承 BuilderSupport 抽象类 | 在 createNode 方法中获取节点名称、节点属性、节点值信息 )
  3. 计算机操作员考评标准,计算机操作员职业技能鉴定标准.doc
  4. Asp.Net Core Authentication Middleware And Generate Token
  5. [ZJOI2007] 棋盘制作(单调栈 / DP悬线法)
  6. 项上的温柔,冬季围巾8大打法图解(组图)
  7. amazeui学习笔记--css(常用组件5)--评论列表Comment
  8. 【kafka】kafka 2.3 版本的kafka topic 分区扩容
  9. exchange 2010 relay设定
  10. git fatal: index file smaller than expected
  11. 帮助浏览器、help函数和doc函数 符号表述的数集
  12. 如何在vs2020编译c语言程序,如何在使用WIN10 Visual Studio 2015 编译FlightGear源码(2020.1.1版本)(示例代码)...
  13. html坦克游戏,HTML5实现经典坦克大战坦克乱走还能发出一个子弹
  14. 中国互联网络发展状况统计报告计算机,CNNIC发布《第22次中国互联网络发展状况统计报告》...
  15. 查看文章影响因子的插件_你的pubmed又不能显示影响因子了,因为 ……
  16. 汇川HnU系列PLC以太网通讯解决方案
  17. 零基础学编程觉得很枯燥,很难坚持学习下去怎么办?
  18. 联想拯救者isk15安装固态硬盘记录
  19. C语言基础篇02:单链表实现学生成绩管理系统
  20. LLMs:《PaLM: Scaling Language Modeling with Pathways》翻译与解读

热门文章

  1. Android程序调用串口开发硬件
  2. 为什么android studio的tools中没有android选项
  3. Web应用程序停止时无法注销它。 为防止内存泄漏,JDBC驱动程序已被强制取消注册。
  4. 今日头条小程序平台今日发布,头条小程序开放了哪些能力?
  5. [译]从《孙子兵法》到软件开发
  6. mac下git使用ssh时候的一个小问题:Permission denied (publickey). fatal: Could not read from remote repository.
  7. Vue 前端路由基础
  8. Mac OS下超级好用的几款软件,强烈安利
  9. android开发必备日志打印工具类
  10. Cropping multiple images the same way