之前我们发现数据录入到hbase中,数据占用的空间变大,所以我们考虑使用压缩来降低,下面是安装使用lzo的过程,在这记录一下备忘。

一、hbase添加LZO

注意:root用户安装,否则安装会出现错误

1、首先要让系统支持lzo动态库,安装lzo-2.00以上版本:http://www.oberhumer.com/opensource/lzo/download/

2、解压 tar -zxvf lzo-2.06.tar.gz

3、进入解压后的目录,执行./configure  --enable-shared

4、执行make进行编译,编译完成后执行make install进行安装lzo

make install库文件被默认安装到了/usr/local/lib,将/usr/local/lib拷贝到/usr/lib下,或者在/usr/lib下建立软连接ln -s /usr/local/lib/* .

6、下载的 hadoop-gpl-compression-0.1.0.jar 到 hbase/lib以及hadoop/lib 中

7、下载的hadoop-gpl-compression-0.1.0中的 lib/native/* 到 hadoop/lib/native 及 hbase/lib/native

8、确保6、7的文件同步到了每台regionserver上

9、在core-site.xml中加上:

io.compression.codecs

com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec

io.compression.codec.lzo.class

com.hadoop.compression.lzo.LzoCodec

安装完成了lzo,可以使用hbase的lzo example来验证一下,执行一下命令:

hbase org.apache.hadoop.hbase.util.CompressionTest hdfs://223.5.12.88:9000/user.dat lzo

二、应用

create 'test', {NAME=>'cf', COMPRESSION=>'lzo'} 按照列族压缩

另外,在网上找了一下资料,发现lzo压缩是发生在compress的过程中,所以向hbase中录入数据后,使用hadoop fs -du /hbase不能很快看到数据空间变小的,或者手动执行compress,或者等待hbase自动执行compress后,才能看到效果。以下是官网截取的信息:

By enabling compression, the store file (HFile) will use a compression algorithm on blocks as they are written (during flushes and compactions) and thus must be decompressed when reading.

hbase 使用lzo_hbase 使用LZO笔记相关推荐

  1. hbase java框架_Hadoop学习笔记—15.HBase框架学习(基础实践篇)

    一.HBase的安装配置 1.1 伪分布模式安装 伪分布模式安装即在一台计算机上部署HBase的各个角色,HMaster.HRegionServer以及ZooKeeper都在一台计算机上来模拟. 首先 ...

  2. 《HBase权威指南》读书笔记5:第五章 客户端API: 管理功能

    类似传统数据库中的DDL 和 DML 模式定义 表 表描述符 HTableDescriptor Writable 和无参数的构造函数 大部分类都有一个无参数的构造函数,这些类都实现了Hadoop 的 ...

  3. Hbase原理与实践(学习笔记一:基本概念):

    相关笔记: <Hbase原理与实践>读书笔记--1.HBase概述_凯哥多帅哦的博客-CSDN博客_hbase的实现原理1.1 HBase前世今生Google当年风靡一时的"三篇 ...

  4. 【hadoop生态之Hbase】HBase部署与使用【笔记+代码】

    二.HBase部署与使用 2.1.部署 Hbase的安装请查看 2.2.简单使用 2.2.1 基本操作 **进入****HBase****客户端命令行** bin/hbase shell 2) 查看帮 ...

  5. Hbase(nosql)体系结构有基本操作 笔记八

    5Hbase(nosql)体系结构有基本操作flumepig Googlebigtable的开源实现 列式数据库 可集群化 可以使用shellwebapi多种方式访问 适合高速读写的场景 Hql查询语 ...

  6. kettle操作mysql,hive,hbase,phoenix性能测试(使用笔记性能测试部分补充和更新)...

    注:前提不泄露公司信息 Mysql数据库连接 主机名或 IP 地址: xxx 端口: xxx 数据库:xxx 用户名: xxxx 保存密码: xxxxx 1.1 mysql写入hive (1)a表 数 ...

  7. HBase数据压缩编码探索

    摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进. 前言 你可曾遇到这种需求,只有几百qps的冷数据缓存,却因为存储水位要浪费几 ...

  8. Hadoop与Hbase基本配置

    在经历了几周的努力之后,终于选择放弃现在安装的稳定版本,转而安装旧版本来部署Sleuthkit-Hadp系统.直到昨天,自己还一直为Inconsistent configuration的错误头疼不已. ...

  9. 大数据学习笔记:Hadoop生态系统

    文章目录 一.Hadoop是什么 二.Hadoop生态系统图 三.Hadoop生态圈常用组件 (一)Hadoop (二)HDFS (三)MapReduce (四)Hive (五)Hbase (六)Zo ...

最新文章

  1. Google 选择 Jetty 放弃 Tomcat
  2. sqlalchemy根据表名动态创建model类
  3. java instanceof 原理_java-在现代JVM实现中如何实现instanceof?
  4. CG-CTF-Web-文件包含
  5. 【C++基础学习】const限定修饰符详解
  6. 如何评价「施一公请辞清华大学副校长,全职执掌西湖大学」?你如何看待西湖大学的发展前景?
  7. shell脚本基础 (一)
  8. cad汉仪长仿宋体_cad长仿宋体下载
  9. 牛客 小米校招 找“异数” 高精度进制转化
  10. 使用微信扫描关注公众号登陆的方法
  11. 【论文学习】5、基于OFDM无线局域网的载波频偏估计
  12. 《剑指offer》专题—算法训练 day02
  13. skycc营销软件为我赚取的第一个30万
  14. OVS CT连接追踪实现NAT
  15. IDEA创建springboot项目
  16. 树形结构根据某一节点向上生成树(无递归)
  17. 简单的c语言实现剪子包袱锤
  18. 好看的HYBBS程序极品论坛模板带插件
  19. 常见的计算机网络设备,计算机的常见网络设备、计算机网络分类及协议S20
  20. 安卓手机坚果云+foldersync同步,出现.tacipart

热门文章

  1. source insight 4.0 代码函数变量符号高亮
  2. 视频教程-ps基础课程绝对初级,小白听得懂-Photoshop
  3. 如何系统学游戏建模?游戏建模必备知识有哪些?
  4. 唯美多功能自适应个人主页源码html
  5. 深入探索透视投影变换(续)
  6. 来看看未来最有前景的行业
  7. 数据分析师的任职要求——阿里巴巴
  8. enumerate用法总结
  9. 项目销售实用技巧(精华,销售,售前必看)
  10. 【一览表】macOS代号\macOS版本\苹果电脑各型号对应的macOS版本列表