2019独角兽企业重金招聘Python工程师标准>>>

Hadoop支持好几种压缩算法,包括:

Bzip2

Gzip

DEFLATE

Hadoop提供这些算法的Java实现,所以可以很方便的通过FileSystem API来进行文件的压缩和解压缩。这些压缩算法都有一个缺陷,那就是文件不能被分片(splittable)。这就意味着采用这些算法进行压缩的文件需要读取整个文件才能将文件解压缩。这对MapReduce会产生致命的影响,因为这意味着一个压缩文件必须由一个map来处理。这也正是LZO优越之处,LZO压缩的文件是可分片的(这要感谢Hadoop社区的不懈努力)。

LZO的安装与配置步骤如下:

1.从https://github.com/kevinweil/hadoop-lzo下载Hadoop-LZO(注意Hadoop-LZO有两个版本,分别由Cloudera和Twitter维护),一般建议采用Twitter版本。

2.安装lzo和lzo-devel包。在联网情况下可以非常方便的进行安装。

在Red Hat下通过下面的命令:

#yum install liblzo-devel

在Ubuntu下通过下面的命令:

#apt-get install liblzo2-devel

如果是在断网的情况下可以到网站http://www.oberhumer.com/opensource/lzo/下载lzo源码,下载完成后通过下面的命令完成LZO的安装:

#tar -zxf lzo-2.06.tar.gz#cd lzo-2.06#./configure --enable-shared #make#make install

安装完成后要确保.so文件放在/usr/lib和/usr/lib64文件夹下面(/usr/lib/liblzo2.so /usr/lib64/liblzo2.so)。LZO需要在集群中的每一个节点进行安装。

安装完成后最好把LZOP也安装上,以便在本地使用,LZOP的下载地址:http://www.lzop.org/。

3.编译和安装Hadoop-LZO

首先需要下载和安装apache-ant,这里不再做详细的介绍。然后通过下面的命令进行编译:

32位机器

#export CFLAGS=-m32#export CXXFLAGS=-m32#ant compile-native

64位机器

#export CFLAGS=-m64#export CXXFLAGS=-m64#ant compile-native tar

在编译过程中需要ivy依赖解析,可以联网活着将依赖包拷到机器上。

4.将编译好的HADOOP-LZO拷贝到Hadoop安装目录下相应的文件夹。在Hadoop-LZO的主目录下执行下面的相关命令:

#cp build/hadoop-lzo*.jar $HADOOP_HOME/lib/#tar -cBf - -C build/hadoop-lzo-0.4.15/lib/native/ . | tar -xBvf - -C $HADOOP_HOME/lib/native

5.配置Hadoop,在core-site.xml中添加如下内容:

<property>

<name>io.compression.codecs</name>

<value>org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoop.io.compress.BZip2Codec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec

</value>

</property>

<property>

<name>io.compression.codec.lzo.class</name>

<value>com.hadoop.compression.lzo.LzoCodec</value>

</property>

6.测试Hadoop-Lzo是否安装成功

首先在本地压缩一个文件并将该文件put到HDFS:

#lzop 20120229#hadoop fs -put 20120229.lzo /testdir/

对测试文件进行索引:

#hadoop jar hadoop-lzo-0.4.15.jar com.hadoop.compression.lzo.DistributedLzoIndexer  /testdir/20120229.lzo

查看集群上是否有20120229.lzo.index:

#hadoop fs -ls /testdir/

如果索引文件存在则证明安装成功。

转载于:https://my.oschina.net/sdzzboy/blog/169676

Hadoop LZO的安装与配置相关推荐

  1. Hadoop集群安装及其配置(三台虚拟机)

    Hadoop集群安装及其配置(三台虚拟机) 利安装配置前准备--安装虚拟机 利用cat查看配置文件 修改主机名称 配置IP映射 配置网卡设备的mac地址 Xshell的安装与配置 ssh的配置 JDK ...

  2. 第六天 - 安装第二、三台CentOS - SSH免密登陆 - hadoop全分布式安装、配置、集群启动

    第六天 - 安装第二.三台CentOS - SSH免密登陆 - hadoop全分布式安装.配置.集群启动 第六天 - 安装第二.三台CentOS - SSH免密登陆 - hadoop全分布式安装.配置 ...

  3. Ubuntu16.04下Hadoop的本地安装与配置

    一.系统环境 os : Ubuntu 16.04 LTS 64bit jdk : 1.8.0_161 hadoop : 2.6.4 部署时使用的用户名为hadoop,下文中需要使用用户名的地方请更改为 ...

  4. 一脸懵逼学习基于CentOs的Hadoop集群安装与配置(三台机器跑集群)

    1:Hadoop分布式计算平台是由Apache软件基金会开发的一个开源分布式计算平台.以Hadoop分布式文件系统(HDFS)和MapReduce(Google MapReduce的开源实现)为核心的 ...

  5. Hadoop集群安装与配置

    转载自Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS 本教程讲述如何配置 Hadoop 集群,默认读者已经掌握了 Hadoop 的单机伪分布式配置,否则请先查看Had ...

  6. Hadoop学习--Hive安装与配置

    最近在学习Hive的安装与使用,第一次使用还是遇到了很多问题.下面介绍下具体的过程. 开发环境: ubuntu10.04 jdk:1.7.0_40 Hadoop:1.2.1 1.下载安装包 首先从ht ...

  7. [Hadoop集群模式安装与配置全过程]红帽子RatHat6下hadoop集群模式安装(3个节点,master,slave1,slave2)

    红帽子RatHat6下hadoop集群模式安装(3个节点,master,slave1,slave2) 一.学习目标: 使用红帽子RatHat6在虚拟机上搭建hadoop集群,包含3个节点,体验集群分布 ...

  8. Hadoop 2.2.0安装和配置lzo

    2019独角兽企业重金招聘Python工程师标准>>> Hadoop经常用于处理大量的数据,如果期间的输出数据.中间数据能压缩存储,对系统的I/O性能会有提升.综合考虑压缩.解压速度 ...

  9. lzo的安装及在hadoop中的配置

    一.前提 1.gcc的安装:yum install lib* glibc* gcc* 如果lzo编译出错时可能需要安装 2.ant的安装:安装略,最好1.8.2及以上版本,并设置好环境变量 在第三步需 ...

最新文章

  1. 标准C函数库的使用方法
  2. 关于Keychain
  3. 易语言超文本ctrl c,易语言超文本浏览框处理键盘消息源码
  4. 安徽大学java期末_安微大学2017~2018年度期末考试题卷
  5. BZOJ2298: [HAOI2011]problem a(带权区间覆盖DP)
  6. 如何使用 GRUB 2 直接从硬盘运行 ISO 文件
  7. Spring在Web中的应用
  8. Toontrack Superior Drummer for Mac(鼓音乐制作工具)
  9. 天地不仁,以万物为刍狗
  10. OpenCV边缘检测算法
  11. Linksys WRT54G 路由器溢出漏洞分析—— 运行环境修复
  12. access中,客户端和服务器端链接数据库的详细代码
  13. indexedDB简单介绍
  14. Python编程——Python基础知识之列表(-)
  15. vue 自动填充_通过邮政编码与Ziptastic自动填充城市和州
  16. 香港域名总量止跌回升 7月第一周新增4279个
  17. 计算机二级python 知识点篇(文件和数据格式化)
  18. 海店湾护法系列:你知道吃什么食物会使自己的秀发加速脱发么?
  19. 转:免费国际长途 热门应用Line发布中文版
  20. 计算机二级20天可以学出来吗,学工干货丨如何三天通过计算机二级

热门文章

  1. 超市收银程序_超市收银系统案例|千平超市再开2家,星耀助力门店年关创收...
  2. android 获取存储卡,Android获取存储卡路径的方式
  3. Matlab实用程序--图形应用-变换的傅立叶函数曲线
  4. 2021-03-31 Matlab simulink 模糊PID在无刷直流电机中的应用
  5. ajax 更新页面变量,[Django 1.5] jQuery/Ajax 在Django使用 ,如何更新模板里里变量
  6. java中 hashmap中小数,java基础知识--HashMap中对 h(length-1)的理解
  7. sqlsourcesafe mysql_mysql权限问题,看不到其它的库!
  8. tp5 excel 导入 mysql_TP5框架下MySQL通过LOAD DATA INFILE批量导入数据详细操作
  9. 小鑫の日常系列故事(六)——奇遇记_JAVA
  10. C++返回引用,使用引用接收和非引用接收的区别