import com.hadoop.compression.lzo.LzoIndexer;
import com.hadoop.compression.lzo.LzopCodec;FileOutputFormat. setCompressOutput( job, true); // 设置压缩
FileOutputFormat. setOutputCompressorClass( job, LzopCodec.class ); // 选择压缩类型

result = job .waitForCompletion( true) ? 0 : -1;// 输出路径 生成索引
LzoIndexer lzoIndexer = new LzoIndexer(getConf());
lzoIndexer.index( new Path( args[1]));

生成lzo文件 并生成索引

job.setInputFormatClass(LzoTextInputFormat.class);

读取lzo类型的文件

转载于:https://www.cnblogs.com/feelgood/p/5110886.html

hadoop mapreduce lzo相关推荐

  1. Hadoop之Lzo压缩配置

    Hadoop之Lzo压缩配置 一.hadoop-lzo编译 hadoop本身并不支持lzo压缩,故需要使用twitter提供的hadoop-lzo开源组件.hadoop-lzo需依赖hadoop和lz ...

  2. Hadoop配置lzo

    Hadoop配置lzo 编译部署参考:https://blog.csdn.net/weixin_40420525/article/details/84869883 一.编译: 0. 环境准备 mave ...

  3. Hadoop配置lzo压缩

    前言 OS:CentOS 7 hadoop:2.7.7 lzo:lzo-2.10 Apache Maven:3.6.0 JDK:1.8.0_221 hadoop-lzo是一个围绕lzo压缩算法实现的M ...

  4. hadoop支持lzo完整过程

    转自 http://blog.csdn.net/joseph_happy/article/details/50374057 简介 部署 安装lzop native library 安装hadoop-l ...

  5. windows下hadoop对lzo的支持

    windows下hadoop对lzo的支持 背景 下半年学习大数据,首当其冲,先学习了hadoop 学习hadoop的过程可谓是艰难重重 其中最麻烦的就是本地调式,写代码总会有bug,在网上也找到一些 ...

  6. 又双叒叕来更新啦!Hadoop———MapReduce篇

    文章目录 MapReduce(计算) MapReduce概述 MapReduce定义 MapReduce的优缺点 核心思想 MapReduce计算程序运行时的相关进程 官方WordCount源码 Ma ...

  7. hadoop错误: 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

    错误: 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster 原创hongxiao2016 最后发布于2019-03-30 21:20:5 ...

  8. hadoop调用python算法_使用Python实现Hadoop MapReduce程序

    根据上面两篇文章,下面是我在自己的ubuntu上的运行过程.文字基本采用博文使用Python实现Hadoop MapReduce程序,  打字很浪费时间滴. 在这个实例中,我将会向大家介绍如何使用Py ...

  9. Hadoop MapReduce编程 API入门系列之最短路径(十五)

    不多说,直接上代码. ====================================== = Iteration: 1 = Input path: out/shortestpath/inpu ...

最新文章

  1. 设置文字QT按钮包含图片与文字,以及鼠标停留备注显示,和sheetstyle风格设置。...
  2. Instruments of Xcode
  3. linux下文件夹的创建、复制、剪切、重命名、清空和删除命令
  4. 哪个星座更适合做产品经理?
  5. Spring整合Hibernate 二 - 声明式的事务管理
  6. 剑指 Offer 43. 1~n 整数中 1 出现的次数(可能是最简洁易懂的)
  7. 没有工作经验找it_校招和社招有什么区别?没有工作经验,如何找工作?
  8. win7 安装 Visual Studio 2015 出现 “Failed to install MSI package 等错误”
  9. Android实现按钮点击效果(第一次点击变色,第二次恢复)
  10. 【报告分享】2021年品牌CDP与营销数字化转型报告.pdf(附下载链接)
  11. poj 2396 Budget 边容量有上下界的最大流
  12. 痞子衡嵌入式:如果你正在量产i.MX RT产品,不妨试试这款神器RT-Flash
  13. 知识图谱:【图数据库Nebula(一)】——Nebula简介
  14. 【程序员如何买基金 三】场内场外交易的区别
  15. python定义一个字符串变量_python基础入门语法和变量类型(一)
  16. mysql 多表中间表查询_mysql多表连接查询
  17. 大学计算机基础网络应用第二套,大学计算机基础)应用指导(第2版
  18. 浏览器访问一个页面的步骤详解
  19. 批量删除时传参的转换
  20. 毕业设计效果展示:改良的CP-VTON(ICP-VTON)模型

热门文章

  1. java 静态内部类 内部类_Java中内部类和静态内部类的区别
  2. php中unset函数是在哪一章_PHP引用(amp;)使用详解
  3. linux下文件下载中文,LINUX环境下资源下载中文目录及中文文件名称问题
  4. php预编译mysql扩展_PHP-Mysqli扩展库的预编译
  5. html不同类别的列表设置,HTML --列表
  6. mysql多租户视频_数据库实现多租户支持的思路
  7. 进程外session(session保存在sqlserver)
  8. windows 配置 Gitlab、Gitee(码云) 的git开发环境
  9. swagger连接mysql数据库_一键生成数据库文档,堪称数据库界的Swagger,有点厉害!...
  10. linux服务器 授权命令,linux的Sudo/su授权命令详解