Hadoop/HBase 开启snappy压缩

参考链接
hadoop-snappy Google Code
snappy.compression hbase docs
cnblogs参考资料

  1. install maven

    • 下载maven安装包(apache-maven-xxx.bin.tar.gz) 点击下载
    • 解压文件
      ar -zxvf apache-maven-3.2.1-bin.tar.gz
    • 修改/etc/profile,把maven执行路径添加到环境变量
      export MVN_HOME=/home/qiao/apache-maven-3.2.1
      export PATH=$MVN_HOME/bin:$PATH
    • source /etc/profile使环境变量生效
  2. install snappy

    • 下载snappy click herer to download
    • 解压缩 tar -zxvf snappy-xxx.tar.gz
    • 在解压后的snappy目录中编译安装snappy动态链接库到本地
      $ ./configure
      $ make
      $ make install
    • 默认安装到/usr/local/lib中,颗粒在这个目录中查看,如果出现如下内容,则表示snappy动态链接库安装成功
      $ cd /usr/local/lib
      $ ls
      $ libsnappy.a libsnappy.la libsnappy.so libsnappy.so.1 libsnappy.so.1.2.1
  3. install hadoop-snappy

    • 下载hadoop-snappy,用到svn
      svn checkout http://hadoop-snappy.googlecode.com/svn/trunk/ hadoop-snappy
    • 安装hadoop-snappy,用maven编译安装,将其安装到/usr/local目录中
      mvn package -Dsnappy.prefix=/usr/local
    • 接下来就是复制文件,修改配置文件
    • hadoop

      1. 把hadoop-snappy/target/hadoop-snappy-0.0.1-SNAPSHOT目录中lib目录下所有文件拷贝到Hadoop的lib目录下
        cp -r hadoop-snappy-0.0.1-SNAPSHOT/lib/* /lib
      2. 修改Hadoop配置文件,core-site.xml,添加如下内容

         <property><name>io.compression.codecs</name><value>org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoop.io.compress.BZip2Codec,org.apache.hadoop.io.compress.SnappyCodec</value></property>
      3. 修改Hadoop配置文件,hadoop-env.sh
        export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HADOOP_HOME/lib/native/Linux-amd64-64/:/usr/local/lib/
    • hbase
      1. 将Hadoop文件夹lib/native/Linux-amd64-64/下所有的文件拷贝到相应的hbase目录下
        cp -r $HADOOP_HOME/lib/native/Linux-amd64-64/* $HBASE_HOME/lib/native/Linux-amd64-64/
      2. 修改HBase配置文件hbase-env.sh
        export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HADOOP_HOME/lib/native/Linux-amd64-64/:/usr/local/lib/
        export HBASE_LIBRARY_PATH=$HBASE_LIBRARY_PATH:$HBASE_HOME/lib/native/Linux-amd64-64/:/usr/local/lib/
  4. 重启Hadoop,HBase,snappy压缩功能即可使用

安装过程中遇到的问题: [exec] /usr/bin/ld: cannot find -ljvm
解决办法:出现这样的问题是因为没有把安装的jvm的libjvm.so 链接到/usr/local/lib。因为是64位系统,这里做了如下修改:
ln -s /usr/java/jdk1.6.0_45/jre/lib/amd64/server/libjvm.so /usr/local/lib/
问题解决。

转载于:https://www.cnblogs.com/qyanke/p/4118472.html

Hadoop/HBase 配置snappy压缩相关推荐

  1. 单机hbase-2.4.15配置snappy压缩

    单机hbase配置snappy压缩 前言 1. 过程比较坎坷,网上帖子说法不一,以下过程是参考几个帖子亲自走过一遍,并最终可以成功建表.2. 本人安装的所有目录均为/data/test-hbase,涉 ...

  2. hadoopsnappy解压_Hadoop Snappy 压缩的安装和配置

    snappy是google的一个开源的压缩库,在合理的压缩率的前提下提供了提供了一个很高的压缩/解压的速度,利用单颗Intel Corei7处理器内核处理达到每秒处理250MB~500MB的数据流.s ...

  3. 关于几种压缩算法以及hadoop和hbase中的压缩配置说明

    Hadoop中常用的压缩算法有bzip2.gzip.lzo.snappy,其中lzo.snappy需要操作系统安装native库才可以支持 下面这张表,是比较官方一点的统计,不同的场合用不同的压缩算法 ...

  4. Hadoop配置lzo压缩

    前言 OS:CentOS 7 hadoop:2.7.7 lzo:lzo-2.10 Apache Maven:3.6.0 JDK:1.8.0_221 hadoop-lzo是一个围绕lzo压缩算法实现的M ...

  5. Hadoop学习---Zookeeper+Hbase配置学习

    软件版本号: JDK:jdk-8u45-linux-i586.tar.gz Zookeeper:zookeeper-3.4.6 Hbase:hbase-1.0.0-bin 一.JDK版本更换 由于之前 ...

  6. hadoop中MapReduce中压缩的使用及4种压缩格式的特征的比较

    在比较四中压缩方法之前,先来点干的,说一下在MapReduce的job中怎么使用压缩. MapReduce的压缩分为map端输出内容的压缩和reduce端输出的压缩,配置很简单,只要在作业的conf中 ...

  7. HDFS和Spark配置LZO压缩,Spark读取LZO创建正常Task数量

    1.说明 为了解决,数据日益增长并且目前使用Snappy压缩导致的Spark读取时会出现OOM,并且处理起来速度过慢的问题,决定使用LZO+Index来解决问题. 线上Hadoop版本3.2.1,Sp ...

  8. 【深入理解Hadoop原理】Hadoop 参数配置 详解

    Hadoop 参数配置 详解 一.常用端口 组件 节点 默认端口 配置 用途说明 HDFS DataNode 50010 dfs.datanode.address datanode服务端口,用于数据传 ...

  9. HBASE配置参数说明中文文档(官方文档翻译)

    HBASE所有参数原文加中文译文,方便学习交流研究使用,因使用爬虫获取部分内容翻译可能存在误差,仅供参考,以原文内容为准. 官方原文地址 文章目录 hbase.tmp.dir hbase.rootdi ...

最新文章

  1. ValueError: invalid literal for int() with base 10
  2. pc端,自适应屏幕分辨率
  3. ssd手 和方向检测
  4. js window.onlload 自遐想
  5. 使用腾讯云提供的针对Nuget包管理器的缓存加速服务
  6. spi驱动 (2):应用与测试
  7. 平面设计师必备,剪纸风格素材
  8. 处理器虚拟化——VMX
  9. 计算机核心期刊论文模板,中文核心期刊(论文)模板.doc
  10. g++ warn_unused_result
  11. 网络请求及各类错误代码含义总结(Errors Code)
  12. OSChina 周二乱弹 ——有一天你当了程序员巴巴
  13. 使用Keras 构建基于 LSTM 模型的故事生成器
  14. unipush+java+个推实现app消息推送
  15. Python_删除TXT文件中不想要的内容
  16. Apache OpenNlp的初探
  17. (一)SDRAM——SDRAM入门介绍
  18. 中断API之enable_irq
  19. 黄宇清 java_二面笔记 2015.9.19
  20. Bitmap的图片压缩汇总

热门文章

  1. java swing对话框_Java开发笔记(一百三十五)Swing的文件对话框
  2. 【HDOJ 2020.09.29】一些语法水题ByVJ
  3. html制作文字效果,10个text-shadow制作的文字效果
  4. android serviceconnection unbind流程,Android Service 再次 unbindSrvice 时的问题
  5. sublime后缀_在sublime text中如何设置某种扩展名文件的默认语法
  6. 2017 ACM-ICPC 亚洲区(乌鲁木齐赛区)网络赛 E. Half-consecutive Numbers
  7. css之使用clearfix类清除浮动
  8. python数据驱动测试设计_GitHub - 13691579846/DataDriverTestFrameWork: python+selenium+pageobject数据驱动测试框架...
  9. 图论---桥(割边)
  10. bzoj 1044: [HAOI2008]木棍分割(二分+DP)