MapReduce程序中的万能输入FileInputFormat.addInputPaths
from http://www.linuxidc.com/Linux/2014-11/109697.htm
写MapReduce过程中经常会遇到多个源路径的输入,我们可以在MapReduce程序主函数中通过FileInputFormat.addInputPaths(job,args[0])方法来实现,
args[0]可以是folder1或者folder1,folder2只要以逗号分隔就可以了。
这样在执行MR的时候,输入会将多个源路径全部作为map输入进行执行。
另外一种实现单输入的方法(只支持一个目录作为输入目录):
FileInputFormat.setInputPaths(job, new Path(args[0]));
当然FileInputFormat.addInputPaths是兼容FileInputFormat.setInputPath的,也就是说如果我调用的是多输入路径函数,但是输入数据源只有一个路径,也是能够正常执行的,所以通用起见,FileInputFormat.addInputPaths是个更好的选择。
MapReduce程序中的万能输入FileInputFormat.addInputPaths相关推荐
- chrome麦克风权限_如何在Chrome扩展程序中处理麦克风输入权限和语音识别
chrome麦克风权限 by Palash Taneja 由Palash Taneja 如何在Chrome扩展程序中处理麦克风输入权限和语音识别 (How to handle mic input pe ...
- python获取本月天数_Python从程序中用户的输入中获取每月的天数
这就是我要做的: 用户将按顺序输入年.月数(1-12)和日数.程序将确定日期是在将来还是在过去.(如果输入的日期是今天的日期,则假定该日期是过去的日期).未来的约会是尚未发生的日期.如果今天是7月31 ...
- 一脸懵逼学习Hadoop中的MapReduce程序中自定义分组的实现
1:首先搞好实体类对象: write 是把每个对象序列化到输出流,readFields是把输入流字节反序列化,实现WritableComparable,Java值对象的比较:一般需要重写toStrin ...
- java应用程序中判断用户输入的一个整数是否在已知数组里。
import java.util.*; class Example2_5 {public static void main(String args[]) {int start=0,end,middle ...
- 微信小程序中 input空间输入文字如何清空
场景:希望读取input控件的输入内容之后,清空输入框的内容.由于本人是JS小白,整整花了一两个小时都没找到方法. 原来微信小程序不支持document通过id获取控件的方法,尽管编译不报错,但是实际 ...
- 支付宝小程序中实现搜索输入提示关键字高亮显示
效果如下图所示 输入框输入关键字 后台返回的提示信息 直接上代码 对请求得到的数据进行处理 // 高亮搜索关键字searchTap() {// 分割函数let getInf = (str, k ...
- hadoop FileInputFormat.addInputPaths兼容FileInputFormat.setInputPath
写MR过程中经常会遇到多个源路径的输入,我们可以在MR程序主函数中通过FileInputFormat.addInputPaths(job,args[0])方法来实现, args[0]可以是folder ...
- 第七周项目一-三个函数在一个程序中(5)
/* *Copyright(c)2016,烟台大学计算机与控制工程学院 *All rights reserved *文件名称:123.cpp *作 者:王蕊 *完成日期:2016年4月12日 *版 本 ...
- Mapreduce程序 统计文件中每个单词出现次数
mapreduce程序 统计文件中每个单词出现次数 调用MapReduce对文件中各个单词出现次数进行统计 一.安装环境 二.准备工作 1.创建Hadoop账户 2.更新 apt 3.安装vim 4. ...
最新文章
- One-Page AlphaGo --十分钟看懂 AlphaGo 的核心算法!
- 作为一个上市公司HR,跟大家分享一些面试的真相
- 详细探究Spark的shuffle实现
- Python OOP:继承、单继承、多继承、__mro__、子类重写父类同名属性和方法、子类调用父类同名属性和方法、多层继承、super()、私有(实例)属性和方法、获取修改私有属性值、私有类属性
- 血压监测方案之光电容积脉搏波描记法PPG
- scrum 11.27
- postgresql安装hypopg
- 自媒体图文、视频素材网站哪里找?这些非常好用
- 泰迪杯数据挖掘挑战赛—数据预处理(一)
- 信度spss怎么做_SPSS进行问卷量表信度检验(详细操作过程及结果分析)
- 酒店旅业治安管理系统接口开发
- 华为云 CDN金秋特惠活动,这价可以
- hdu 1548 A strange lift (BFS)
- 通过navicat工具导出word编写数据库设计文档
- 为什么复制的html图片打不开,网页中的图片打不开是什么原因?
- 统一登录passport介绍
- 虚拟化的适用范围和适用场景,服务器虚拟化架构和功能
- 关于鼠标滚动,横向滚动条不滚动问题
- 【Python茴香豆系列】之 PANDAS 如何根据列的值来选取 DataFrame 的行
- Slope Trick
热门文章
- python中的matplotlib用法
- 降低芯片设计创新门槛——从互联网成功经验看开源芯片生态发展
- 基于html5的音乐网站开题,开题报告——基于HTML5的音乐网站.doc
- Unity3d开发之十二:邮箱正则验证js和c#
- 网易im 服务器消息格式,机器人消息体模板说明-IM即时通讯-网易云信开发文档...
- 自动控制的故事——数字控制部分
- Python项目实战:绕圈圈面试题
- Android 9 功能和 API
- Complex-Valued CNN and Its Application in Polarimetric SAR Image Classification
- php k线15分钟 30分钟,15分钟30分钟K线战法