压缩格式

工具

算法

文件扩展名

是否可切分

DEFAULT

DEFAULT

.deflate

Gzip

gzip

DEFAULT

.gz

bzip2

bzip2

bzip2

.bz2

LZO

lzop

LZO

.lzo

LZ4

LZ4

.lz4

Snappy

Snappy

.snappy

为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器,如下表所示

压缩格式

对应的编码/解码器

DEFLATE

org.apache.hadoop.io.compress.DefaultCodec

gzip

org.apache.hadoop.io.compress.GzipCodec

bzip2

org.apache.hadoop.io.compress.BZip2Codec

LZO

com.hadoop.compression.lzo.LzopCodec

LZ4

org.apache.hadoop.io.compress.Lz4Codec

Snappy

org.apache.hadoop.io.compress.SnappyCodec

压缩性能的比较

压缩算法

原始文件大小

压缩文件大小

压缩速度

解压速度

gzip

8.3GB

1.8GB

17.5MB/s

58MB/s

bzip2

8.3GB

1.1GB

2.4MB/s

9.5MB/s

LZO

8.3GB

2.9GB

49.3MB/s

74.6MB/s

Snappy

8.3GB

3G

250MB/S

500 MB/s

建表语句

create table log_orc_snappy(

track_time string,

url string,

session_id string,

referer string,

ip string,

end_user_id string,

city_id string

)

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'

STORED AS orc tblproperties ("orc.compress"="SNAPPY");

# 博学谷IT 技术支持

[博学谷学习记录]超强总结,用心分享|Hive的压缩格式相关推荐

  1. [博学谷学习记录]超强总结,用心分享|第07节 常用的API-----笔记篇

    目录 1.API 1.1 API概述-帮助文档的使用 1.2 键盘录入字符串 2. String类 2.1 String概述 2.2 String类的构造方法 2.4 创建字符串对象的区别对比 2.5 ...

  2. {博学谷学习记录} 超强总结,用心分享|狂野架构师-前置互联网架构演变过程

    本章以系统架构,数据架构,两种维度来进行讲解 目录 1 系统架构 1,1 单体架构 1.2 中台战略 2 数据库架构 2,1 单体架构 2.2 主从读写 2.3 分库分表 3 总结 1 系统架构 1, ...

  3. [博学谷学习记录]超强总结,用心分享|架构 Nacos入门

    提示:学习笔记 欢迎指点 文章目录 前言 一.Nacos安装 二.Nacos服务注册与发现 1.服务提供者Provider 2.服务消费者Consumer 三.Nacos作为配置中心 前言 Nacos ...

  4. [博学谷学习记录]超强总结,用心分享|架构 敏捷 - 开发管理之道

    提示:学习笔记 欢迎指点 文章目录 1.敏捷开发思想之道 2.面向对象开发之道 3.敏捷学习之道 1.敏捷开发思想之道 一名敏捷开发者,敏捷思想的掌握自然首当其冲.在敏捷开发实施的过程中,我们虽然不是 ...

  5. [博学谷学习记录]超强总结,用心分享|第16节 集合续-----笔记篇

    目录 1.HashSet集合 1.1HashSet集合概述和特点[应用] 1.2HashSet集合的基本应用[应用] 1.3哈希值[理解] 1.4哈希表结构[理解] 1.5HashSet集合存储学生对 ...

  6. [博学谷学习记录] 超强总结,用心分享|陌陌综合案例

    注:大家觉得博客好的话,别忘了点赞收藏呀,本人每周都会更新关于人工智能和大数据相关的内容,内容多为原创,Python Java Scala SQL 代码,CV NLP 推荐系统等,Spark Flin ...

  7. [博学谷学习记录]超强总结,用心分享|软件测试之计算机基础(一)

    本周开始学习软件测试,而我也即将开始在平台记录我的学习之路.我会把我的个人心得及掌握的知识发布在此平台,俗话说最好的输入就是输出,希望在输出的同时能有更多的收获,也希望与大家多多交流. 为了更好的学习 ...

  8. [博学谷学习记录]超强总结,用心分享|人工智能机械学习基础知识线性回归总结分享

    1.线性回归的核心是参数学习,线性回归和回归方程(函数)有关 2.线性回归是目标值预期是输入变量的线性组合 3.欠拟合的产生原因是学习到数据的特征过少 4.多元线性回归中的"线性" ...

  9. [博学谷学习记录] 超强总结,用心分享|JavaEE就业课-尊享无忧+Java基础语法|面向对象(1wk)

    学习笔记目录 目录 学习笔记目录 前言 一.变量 1. 关键字:被java赋予特殊含义的字符 2. 常量:不会发生改变的量(数据)​编辑 3. 变量:内存中的存储空间. 4. 类型转换 5. 算术运算 ...

最新文章

  1. Java使用Jdbc操作MySql数据库(一)
  2. 设计模式:单例模式之静态内部类
  3. Android使用ImageView显示网络图片
  4. 阶段1 语言基础+高级_1-2 -面向对象和封装_18定义一个标准的类
  5. linux学习笔记(10)fdisk命令
  6. mysql时间间隔interval_MySQL DATEDIFF函数获取两个日期的时间间隔的方法
  7. PPT下载下来是php,用php下载jpg,doc,ppt文件已损坏
  8. java uuid静态方法_Java UUID version()方法与示例
  9. Query Layer介绍
  10. python中迭代器和可迭代对象的区别_Python 可迭代对象迭代器生成器的区别
  11. python多线程 多进程
  12. git添加多远端服务器并且实现push代码
  13. SQLite3中的SQL基本语句和高级语句
  14. markdown 链接跳转到标题_如何使用markdown语法来写文章
  15. asp.net中使用mschart控件
  16. 超大文本文件浏览器Snaptext,支持不限制大小的文本文件浏览
  17. 多开分身苹果版_【教程】苹果手机居然可以微信分身?全套教程,进来领取
  18. EBS开发_应收发票接口导入
  19. 机器码怎么改?笔记本机器码怎么改?(最新你看你也会)
  20. Vue实现京东登陆页面(仅实现部分功能)

热门文章

  1. 使用和wait让你的脚本并行执行
  2. 简单句 - 主谓/主谓宾/主系表的分析
  3. [CODEVS3032]摆放球 解题报告
  4. 神经网络 c++ 源码 可以直接复制运行,提供数据集,操作简单,最少仅需4行代码
  5. 沙箱支付宝alipay-easysdk java 支付能力对接
  6. html如何用ajax连杰和苏局哭,ajax的探究与使用
  7. 如何解决Linux乱码问题
  8. 【Java基础】swing-图形界面学习(下)
  9. ITE平台开发 chapter5之jperf测试网络吞吐量
  10. 连接跟踪TCP协议状态转换