from http://www.linuxidc.com/Linux/2014-11/109697.htm

写MapReduce过程中经常会遇到多个源路径的输入,我们可以在MapReduce程序主函数中通过FileInputFormat.addInputPaths(job,args[0])方法来实现,

args[0]可以是folder1或者folder1,folder2只要以逗号分隔就可以了。

这样在执行MR的时候,输入会将多个源路径全部作为map输入进行执行。

另外一种实现单输入的方法(只支持一个目录作为输入目录):

FileInputFormat.setInputPaths(job, new Path(args[0]));

当然FileInputFormat.addInputPaths是兼容FileInputFormat.setInputPath的,也就是说如果我调用的是多输入路径函数,但是输入数据源只有一个路径,也是能够正常执行的,所以通用起见,FileInputFormat.addInputPaths是个更好的选择。

MapReduce程序中的万能输入FileInputFormat.addInputPaths相关推荐

  1. chrome麦克风权限_如何在Chrome扩展程序中处理麦克风输入权限和语音识别

    chrome麦克风权限 by Palash Taneja 由Palash Taneja 如何在Chrome扩展程序中处理麦克风输入权限和语音识别 (How to handle mic input pe ...

  2. python获取本月天数_Python从程序中用户的输入中获取每月的天数

    这就是我要做的: 用户将按顺序输入年.月数(1-12)和日数.程序将确定日期是在将来还是在过去.(如果输入的日期是今天的日期,则假定该日期是过去的日期).未来的约会是尚未发生的日期.如果今天是7月31 ...

  3. 一脸懵逼学习Hadoop中的MapReduce程序中自定义分组的实现

    1:首先搞好实体类对象: write 是把每个对象序列化到输出流,readFields是把输入流字节反序列化,实现WritableComparable,Java值对象的比较:一般需要重写toStrin ...

  4. java应用程序中判断用户输入的一个整数是否在已知数组里。

    import java.util.*; class Example2_5 {public static void main(String args[]) {int start=0,end,middle ...

  5. 微信小程序中 input空间输入文字如何清空

    场景:希望读取input控件的输入内容之后,清空输入框的内容.由于本人是JS小白,整整花了一两个小时都没找到方法. 原来微信小程序不支持document通过id获取控件的方法,尽管编译不报错,但是实际 ...

  6. 支付宝小程序中实现搜索输入提示关键字高亮显示

     效果如下图所示 输入框输入关键字 后台返回的提示信息  直接上代码   对请求得到的数据进行处理 // 高亮搜索关键字searchTap() {// 分割函数let getInf = (str, k ...

  7. hadoop FileInputFormat.addInputPaths兼容FileInputFormat.setInputPath

    写MR过程中经常会遇到多个源路径的输入,我们可以在MR程序主函数中通过FileInputFormat.addInputPaths(job,args[0])方法来实现, args[0]可以是folder ...

  8. 第七周项目一-三个函数在一个程序中(5)

    /* *Copyright(c)2016,烟台大学计算机与控制工程学院 *All rights reserved *文件名称:123.cpp *作 者:王蕊 *完成日期:2016年4月12日 *版 本 ...

  9. Mapreduce程序 统计文件中每个单词出现次数

    mapreduce程序 统计文件中每个单词出现次数 调用MapReduce对文件中各个单词出现次数进行统计 一.安装环境 二.准备工作 1.创建Hadoop账户 2.更新 apt 3.安装vim 4. ...

最新文章

  1. One-Page AlphaGo --十分钟看懂 AlphaGo 的核心算法!
  2. 作为一个上市公司HR,跟大家分享一些面试的真相
  3. 详细探究Spark的shuffle实现
  4. Python OOP:继承、单继承、多继承、__mro__、子类重写父类同名属性和方法、子类调用父类同名属性和方法、多层继承、super()、私有(实例)属性和方法、获取修改私有属性值、私有类属性
  5. 血压监测方案之光电容积脉搏波描记法PPG
  6. scrum 11.27
  7. postgresql安装hypopg
  8. 自媒体图文、视频素材网站哪里找?这些非常好用
  9. 泰迪杯数据挖掘挑战赛—数据预处理(一)
  10. 信度spss怎么做_SPSS进行问卷量表信度检验(详细操作过程及结果分析)
  11. 酒店旅业治安管理系统接口开发
  12. 华为云 CDN金秋特惠活动,这价可以
  13. hdu 1548 A strange lift (BFS)
  14. 通过navicat工具导出word编写数据库设计文档
  15. 为什么复制的html图片打不开,网页中的图片打不开是什么原因?
  16. 统一登录passport介绍
  17. 虚拟化的适用范围和适用场景,服务器虚拟化架构和功能
  18. 关于鼠标滚动,横向滚动条不滚动问题
  19. 【Python茴香豆系列】之 PANDAS 如何根据列的值来选取 DataFrame 的行
  20. Slope Trick

热门文章

  1. python中的matplotlib用法
  2. 降低芯片设计创新门槛——从互联网成功经验看开源芯片生态发展
  3. 基于html5的音乐网站开题,开题报告——基于HTML5的音乐网站.doc
  4. Unity3d开发之十二:邮箱正则验证js和c#
  5. 网易im 服务器消息格式,机器人消息体模板说明-IM即时通讯-网易云信开发文档...
  6. 自动控制的故事——数字控制部分
  7. Python项目实战:绕圈圈面试题
  8. Android 9 功能和 API
  9. Complex-Valued CNN and Its Application in Polarimetric SAR Image Classification
  10. php k线15分钟 30分钟,15分钟30分钟K线战法