Streaming支持多路输出(SuffixMultipleTextOutputFormat)

如下示例:

Hadoop streaming \

-input /home/mr/data/test_tab/ \

-output /home/mr/output/tab_test/out19 \

-outputformatorg.apache.hadoop.mapred.lib.SuffixMultipleTextOutputFormat\  # 指定outputformat为org.apache.hadoop.mapred.lib.SuffixMultipleTextOutputFormat

-jobconf suffix.multiple.outputformat.filesuffix=a,c,f,abc,cde \            # 指定输出文件名的前缀,所有需要输出的文件名必须通过该参数配置,否则job会失败

-jobconf suffix.multiple.outputformat.separator="#"\                        #设置value与文件名的分割符,默认为“#”,如果value本身含有“#”,则可以通过该参数设置其他的分隔符

-mapper "cat" \

-reducer "sh reduce.sh" \

-file reduce.sh

注:标记为红色的参数必须设置,参数说明请见注释

Map或者reduce里需要在每个记录的reduce追加“#+文件名”

#!/bin/bash

while read line

do

key=$(echo $line | awk -F' ' '{print $1}')

value=$(echo $line | awk -F' ' '{print $2}')

if [ "$key" == "a" ]

then

echo"$key       $value#a"

fi

if [ "$key" == "c" ]

then

echo "$key    $value#c"

fi

if [ "$key" =="f" ]

then

echo "$key    $value#f"

fi

if [ "$key" =="abc" ]

then

echo "$key    $value#abc"

fi

if [ "$key" =="cde" ]

then

echo "$key    $value#cde"

fi

done

MapReduce如何使用多路输出相关推荐

  1. MapReduce工作笔记——Streaming多路输出

    文章目录 多路输出 实现 MapReduce工作笔记 系列目录:MapReduce工作笔记--目录 多路输出 加入如下命令: -outputformat org.apache.hadoop.mapre ...

  2. Hadoop Streaming 实战: 多路输出

    streaming把reduce的输出作为一个任务的最终输出,输出文件形如:       part-00000.part-00001--       文件个数为reduce任务个数 但是,有的时候,我 ...

  3. ITK:多路输出不同的类型

    ITK:多路输出不同的类型 内容提要 C++实现代码 内容提要 编写一个具有多个不同类型输出的过滤器. C++实现代码 #include "itkImage.h" #include ...

  4. ITK:多路输出相同类型的

    ITK:多路输出相同类型的 内容提要 C++实现代码 内容提要 编写一个具有多个相同类型输出的过滤器. C++实现代码 #include "itkImage.h" #include ...

  5. 半桥llc 增益 matlab程序,半桥LLC谐振设计多路输出辅助电源

    引言 随着电力电子技术的发展,稳定.可靠.低EMI成为对辅助电源最基本的要求.本文详细介绍了一种多路输出,而且相互独立的新型辅助电源的设计方法. 设计采用AC/DC-AC/DC的变换方案.不控整流后的 ...

  6. 多路输出开关电源的设计及应用原则

    1引言 对现代电子系统,即便是最简单的由单片机和单一I/O接口电路所组成的电子系统来讲, 其电源电压一般也要由+5V,±15V或±12V等多路组成,而对较复杂的电子系统来讲,实际用到的电源电压就更多了 ...

  7. hadoop中带后缀的多路输出part文件

    [导读] hadoop源代码中org.apache.hadoop.mapred.lib.MultipleTextOutputFormat类实现了多路输出的框架.在此基础上,可以实现自定义的多路输出方案 ...

  8. flink-cdc,clickhouse写入,多路输出

    1.场景 kafka日志数据从kafka读取 1.关联字典表:完善日志数据 2.判断日志内容级别:多路输出 低级:入clickhouse 高级:入clickhouse的同时推送到kafka供2次数据流 ...

  9. ffmpeg转码多路输出(二)

    ffmpeg转码多路输出(二) 本程序支持一路输入多路输出,可根据map配置自行添加,第1路为纯拷贝,其他2路经过编解码,格式转换缩放和重采样,纯拷贝方面不同格式适应方面还没做全,以后补充.本程序适合 ...

  10. STM32F7同一定时器多路输出PWM波通道之间相互影响问题

    --------------------------2020/8/12更新-------------------------------- 这次用Cube直接生成PWM控制代码,然后再RT-Threa ...

最新文章

  1. 多因子降维法(MDR,Multifactor Dimensionality Reduction )
  2. 银行程序代发工资的方法
  3. C#委托的介绍(delegate、Action、Func、predicate)
  4. jQuery的each()方法
  5. 非易失性内存在阿里生产环境的首次应用:Tair NVM最佳实践总结
  6. Linux查询root环境变量,linux环境变量和查看方法
  7. Oracle创建序列,删除序列
  8. OSChina 周四乱弹 ——巴叔是雾霾治理小先锋
  9. 【机器学习】监督学习--(回归)一元线性回归
  10. 【clickhouse】Clickhouse 集成 presto
  11. 如何理解Spring对缓存的支持
  12. 云计算创业在美国真是如火如荼。
  13. 西电捷通IWN2410(V600)WAPI鉴别服务器生成的PEM(X.509)证书文件样式
  14. js练习:模拟京东快递单号查询
  15. 用迅雷打开php文件,迅雷下的php文件怎么打开啊?
  16. 单词数 HDU - 2072 纯字典树个人理解
  17. trunk vlan pvid 学习实验整理 2
  18. 猿创征文 | 2023年必须掌握的DevOps工具推荐(一)
  19. SKEY协议设计实验
  20. 针对应用程序的专为Windows XP设计徽标

热门文章

  1. Newtonsoft.Json序列化和反序列之javascriptConvert.SerializeObject,DeserializeObject,JsonWriter,JsonReader...
  2. Linux_防火墙入门01:以太网的诞生与演变历程
  3. 2.3Word2003段落设置1
  4. 2011年6月CISA考试报名时间公布
  5. 如何解决xp进系统的时候需要按enter键
  6. Sun发布MySQL 5.4 响应速度提升90% ?
  7. CCNA培训课总结笔记--静态路由实现负载均衡(四)
  8. wordpress音乐播放器插件–PoiPlayer
  9. 课程笔记--复习专用
  10. nyoj1140鸡蛋栈(怒切一水)