Java压缩技术(四) GZIP——Java原生实现
转载自 Java压缩技术(四) GZIP——Java原生实现
GZIP常常用在linxu环境下,是一种非常简单的压缩算法。在Java实现API中,它仅仅包含两个实现类:GZIPInputStream和GZIPOutputStream。
GZIPOutputStream类用于压缩
GZIPInputStream类用于解压缩
先说压缩实现,GZIPOutputStream只有一个方法用于压缩,就是带定长的write方法。简单调用如下文所示:
- /**
- * 数据压缩
- *
- * @param is
- * @param os
- * @throws Exception
- */
- public static void compress(InputStream is, OutputStream os)
- throws Exception {
- GZIPOutputStream gos = new GZIPOutputStream(os);
- int count;
- byte data[] = new byte[BUFFER];
- while ((count = is.read(data, 0, BUFFER)) != -1) {
- gos.write(data, 0, count);
- }
- gos.finish();
- gos.flush();
- gos.close();
- }
记得完成操作后,调用finish方法和flush方法!
核心的压缩实现就这么多!
对于解压缩,GZIPInputStream也对应GZIPOutputStream提供了一个带定长的read方法。简单调用如下文所示:
- /**
- * 数据解压缩
- *
- * @param is
- * @param os
- * @throws Exception
- */
- public static void decompress(InputStream is, OutputStream os)
- throws Exception {
- GZIPInputStream gis = new GZIPInputStream(is);
- int count;
- byte data[] = new byte[BUFFER];
- while ((count = gis.read(data, 0, BUFFER)) != -1) {
- os.write(data, 0, count);
- }
- gis.close();
- }
就这么简单! 核心内容完毕!
顺便补充一下,在liunx下操作gzip命令
gzip file 用于压缩,如 gzip a.txt 将得到文件 a.txt.gz , 同时删除文件a.txt!。
gzip -d file.gz 用于解压缩,如 gzip -d a.txt.gz 将得到文件 a.txt , 同时删除文件a.txt.gz!。
根据这些特性,我补充了相应的文件操作实现,详见下文!
完整实现:
- /**
- * 2010-4-13
- */
- package org.zlex.commons.io;
- import java.io.ByteArrayInputStream;
- import java.io.ByteArrayOutputStream;
- import java.io.File;
- import java.io.FileInputStream;
- import java.io.FileOutputStream;
- import java.io.InputStream;
- import java.io.OutputStream;
- import java.util.zip.GZIPInputStream;
- import java.util.zip.GZIPOutputStream;
- /**
- * GZIP工具
- *
- * @author <a href="mailto:zlex.dongliang@gmail.com">梁栋</a>
- * @since 1.0
- */
- public abstract class GZipUtils {
- public static final int BUFFER = 1024;
- public static final String EXT = ".gz";
- /**
- * 数据压缩
- *
- * @param data
- * @return
- * @throws Exception
- */
- public static byte[] compress(byte[] data) throws Exception {
- ByteArrayInputStream bais = new ByteArrayInputStream(data);
- ByteArrayOutputStream baos = new ByteArrayOutputStream();
- // 压缩
- compress(bais, baos);
- byte[] output = baos.toByteArray();
- baos.flush();
- baos.close();
- bais.close();
- return output;
- }
- /**
- * 文件压缩
- *
- * @param file
- * @throws Exception
- */
- public static void compress(File file) throws Exception {
- compress(file, true);
- }
- /**
- * 文件压缩
- *
- * @param file
- * @param delete
- * 是否删除原始文件
- * @throws Exception
- */
- public static void compress(File file, boolean delete) throws Exception {
- FileInputStream fis = new FileInputStream(file);
- FileOutputStream fos = new FileOutputStream(file.getPath() + EXT);
- compress(fis, fos);
- fis.close();
- fos.flush();
- fos.close();
- if (delete) {
- file.delete();
- }
- }
- /**
- * 数据压缩
- *
- * @param is
- * @param os
- * @throws Exception
- */
- public static void compress(InputStream is, OutputStream os)
- throws Exception {
- GZIPOutputStream gos = new GZIPOutputStream(os);
- int count;
- byte data[] = new byte[BUFFER];
- while ((count = is.read(data, 0, BUFFER)) != -1) {
- gos.write(data, 0, count);
- }
- gos.finish();
- gos.flush();
- gos.close();
- }
- /**
- * 文件压缩
- *
- * @param path
- * @throws Exception
- */
- public static void compress(String path) throws Exception {
- compress(path, true);
- }
- /**
- * 文件压缩
- *
- * @param path
- * @param delete
- * 是否删除原始文件
- * @throws Exception
- */
- public static void compress(String path, boolean delete) throws Exception {
- File file = new File(path);
- compress(file, delete);
- }
- /**
- * 数据解压缩
- *
- * @param data
- * @return
- * @throws Exception
- */
- public static byte[] decompress(byte[] data) throws Exception {
- ByteArrayInputStream bais = new ByteArrayInputStream(data);
- ByteArrayOutputStream baos = new ByteArrayOutputStream();
- // 解压缩
- decompress(bais, baos);
- data = baos.toByteArray();
- baos.flush();
- baos.close();
- bais.close();
- return data;
- }
- /**
- * 文件解压缩
- *
- * @param file
- * @throws Exception
- */
- public static void decompress(File file) throws Exception {
- decompress(file, true);
- }
- /**
- * 文件解压缩
- *
- * @param file
- * @param delete
- * 是否删除原始文件
- * @throws Exception
- */
- public static void decompress(File file, boolean delete) throws Exception {
- FileInputStream fis = new FileInputStream(file);
- FileOutputStream fos = new FileOutputStream(file.getPath().replace(EXT,
- ""));
- decompress(fis, fos);
- fis.close();
- fos.flush();
- fos.close();
- if (delete) {
- file.delete();
- }
- }
- /**
- * 数据解压缩
- *
- * @param is
- * @param os
- * @throws Exception
- */
- public static void decompress(InputStream is, OutputStream os)
- throws Exception {
- GZIPInputStream gis = new GZIPInputStream(is);
- int count;
- byte data[] = new byte[BUFFER];
- while ((count = gis.read(data, 0, BUFFER)) != -1) {
- os.write(data, 0, count);
- }
- gis.close();
- }
- /**
- * 文件解压缩
- *
- * @param path
- * @throws Exception
- */
- public static void decompress(String path) throws Exception {
- decompress(path, true);
- }
- /**
- * 文件解压缩
- *
- * @param path
- * @param delete
- * 是否删除原始文件
- * @throws Exception
- */
- public static void decompress(String path, boolean delete) throws Exception {
- File file = new File(path);
- decompress(file, delete);
- }
- }
罗嗦了半天,到底行不行?
来个测试用例,测试用例如下所示:
- /**
- * 2010-4-13
- */
- package org.zlex.commons.compress.compress;
- import static org.junit.Assert.assertEquals;
- import java.io.DataInputStream;
- import java.io.File;
- import java.io.FileInputStream;
- import java.io.FileOutputStream;
- import org.junit.Test;
- /**
- * @author <a href="mailto:zlex.dongliang@gmail.com">梁栋</a>
- * @since 1.0
- */
- public class GZipUtilsTest {
- private String inputStr = "zlex@zlex.org,snowolf@zlex.org,zlex.snowolf@zlex.org";
- @Test
- public final void testDataCompress() throws Exception {
- System.err.println("原文:\t" + inputStr);
- byte[] input = inputStr.getBytes();
- System.err.println("长度:\t" + input.length);
- byte[] data = GZipUtils.compress(input);
- System.err.println("压缩后:\t");
- System.err.println("长度:\t" + data.length);
- byte[] output = GZipUtils.decompress(data);
- String outputStr = new String(output);
- System.err.println("解压缩后:\t" + outputStr);
- System.err.println("长度:\t" + output.length);
- assertEquals(inputStr, outputStr);
- }
- @Test
- public final void testFileCompress() throws Exception {
- FileOutputStream fos = new FileOutputStream("d:/f.txt");
- fos.write(inputStr.getBytes());
- fos.flush();
- fos.close();
- GZipUtils.compress("d:/f.txt", false);
- GZipUtils.decompress("d:/f.txt.gz", false);
- File file = new File("d:/f.txt");
- FileInputStream fis = new FileInputStream(file);
- DataInputStream dis = new DataInputStream(fis);
- byte[] data = new byte[(int) file.length()];
- dis.readFully(data);
- fis.close();
- String outputStr = new String(data);
- assertEquals(inputStr, outputStr);
- }
- }
结果如何?
先看testDataCompress()方法控制台输出结果。
控制台输出如下:
原文: zlex@zlex.org,snowolf@zlex.org,zlex.snowolf@zlex.org
长度: 52
压缩后:
长度: 45
解压缩后: zlex@zlex.org,snowolf@zlex.org,zlex.snowolf@zlex.org
长度: 52
这里使用英文字符做测试,当输入字符串的字节数大于50左右时,压缩效果明显;如果这里使用中文压缩,可能当压缩上千字节时方能体现出压缩效果!
对于文件操作,朋友们可以自行实验,我代码里的实现是按照gzip命令来的!
举例来说:
压缩时,将文件a.txt压缩为a.txt.gz,同时删除文件a.txt。
解压缩时,将文件a.txt.gz解压缩为a.txt,同时删除文件a.txt.gz。
注意执行testFileCompress方法,查看产生的文件! 你大可以放到linux上去做验证!
commons也提供了GZIP算法的实现,甚至更多种压缩算法(tar、bzip2等)的实现,有机会我将继续整理!
- gzip.rar (1.5 KB)
- 下载次数: 516
Java压缩技术(四) GZIP——Java原生实现相关推荐
- java 压缩技术_Java压缩技术(三) ZIP解压缩——Java原生实现
JavaEye的朋友跟我说:"你一口气把ZIP压缩和解压缩都写到一个帖子里,我看起来很累,不如分开好阅读".ok,面向读者需求,我做调整,这里单说ZIP解压缩! 相关链接: Jav ...
- Java压缩技术(五) GZIP相关——浏览器解析
转载自 Java压缩技术(五) GZIP相关--浏览器解析 GZIP本身就是一种网络流压缩算法,而且应用相当广泛.如果网络访问过程中,其数据流较大,势必降低网络访问效率,此时就需要考虑使用压缩!当 ...
- Java压缩技术(三) ZIP解压缩——Java原生实现
转载自 Java压缩技术(三) ZIP解压缩--Java原生实现 解压缩与压缩运作方式相反,原理大抵相同,由ZipInputStream通过read方法对数据解压,同时需要通过CheckedInp ...
- Java压缩技术(二) ZIP压缩——Java原生实现
转载自 Java压缩技术(二) ZIP压缩--Java原生实现 查过相关资料后才知道,ZIP应该算作归档类的压缩算法,每一门学科都可深可浅! 闲言少叙,先说ZIP压缩. zip压缩需要通过Zip ...
- Java压缩技术(七) TAR——Commons实现
转载自 Java压缩技术(七) TAR--Commons实现 顺便复习一遍linux命令: tar cf <file.tar> <file>将由文件<file> ...
- java压缩gz指定编码,java压缩编码之GZIP
逆向分析中将分析结果的 byte[ ] 以十六进制的形式打印出来,常常会遇到这样的格式: 1F8B08000000000000002597C712ABBC0E809FE69C......省略N多... ...
- java 压缩文件tar_使用Java API进行tar.gz文件及文件夹压缩解压缩
在java(JDK)中我们可以使用ZipOutputStream去创建zip压缩文件,(参考我之前写的文章 使用java API进行zip递归压缩文件夹以及解压 ),也可以使用GZIPOutputSt ...
- 【Java并发编程 四】Java的进程与线程
什么是进程?进程是程序的⼀次执⾏过程,是系统运⾏程序的基本单位,因此进程是动态的.系统运行和关闭⼀个程序即是⼀个进程从创建,运⾏到消亡的过程.在 Java 中,当我们启动 main 函数时其实就是启动 ...
- 三流Java搞技术,二流Java搞框架,一流Java…
对于 Java 程序员来说,若想实现质的飞跃,还得靠"黄金五年". "黄金五年"其实是 Java 程序界流行的说法,指一个程序员从入职的时候算起,前五年的选择和 ...
最新文章
- 7——条件判断、三目运算、条件循环、迭代循环
- HDU - 1255 覆盖的面积(线段树求矩形面积交 扫描线+离散化)
- 云端计算模型的MATLAB仿真与分析
- WS_EX_COMPOSITED是个BUG?
- C/C++中near和far的区别
- MapTask、ReduceTask并行度决定机制
- 计算机系统遵循,自考《计算机系统结构》第10章精讲
- MySQL管理利器 MySQL Utilities---mysqlreplicate
- WordPress主题 酱茄模块源码
- poj 3083 Children of the Candy Corn(bfs+dfs 数组模拟方向)
- 明晚直播丨一次特殊的 Oralce 硬解析性能问题的技术分享
- NYOJ98 - 成绩转换
- 一个简易的选择小时(时分秒)的插件
- win10 shift+右键打开cmd
- CAD图形导入Altium Designer PCB主要事项
- 开启功放安桥TX-NR515的ARC(音频回传通道)功能
- L2TP/IPSec 服务端安装
- 利用python实现简单的人工神经网络识别手写数字
- FFmpeg的HEVC解码器源代码简单分析:解码器主干部分
- Charles工具使用教程,以及注意事项。
热门文章
- map容器实现一对多
- [PAT乙级]1029 旧键盘
- AcWing 1113. 红与黑
- Power Strings POJ - 2406(求一串字符串中有多少个循环节)
- 查看node的位置_升级Node版本RN项目运行报错cb.apply is not a function
- 最小生成树Prime算法
- SP22343 NORMA2 - Norma(分治优化复杂度)
- Educational Codeforces Round 76 (Rated for Div. 2) F. Make Them Similar 折半搜索
- 免费馅饼 HDU - 1176
- P4381 [IOI2008]Island