Protobuffer和json深度对比

JSON相信大家都知道是什么东西,如果不知道,那可就真的OUT了,GOOGLE一下去。这里就不介绍啥的了。

Protobuffer大家估计就很少听说了,但如果说到是GOOGLE搞的,相信大家都会有兴趣去试一下,毕竟GOOGLE出口,多属精品。

Protobuffer是一个类似JSON的一个传输协议,其实也不能说是协议,只是一个数据传输的东西罢了。

那它跟JSON有什么区别呢?

跨语言,这是它的一个优点。它自带了一个编译器,protoc,只需要用它进行编译,可以编译成JAVA、python、C++代码,暂时只有这三个,其他就暂时不要想了,然后就可以直接使用,不需要再写任何其他代码。连解析的那些都已经自带有的。JSON当然也是跨语言的,但这个跨语言是建立在编写代码的基础上。

如果想再深入了解的,可以去看看:

https://developers.google.com/protocol-buffers/docs/overview

好了,废话不多说,我们直接来看看,为什么我们需要对比protobuffer(下面简称GPB)和JSON。

1、JSON因为有一定的格式,并且是以字符存在的,在数据量上还有可以压缩的空间。而GPB上大数据量时,空间比JSON小很多,等一下的例子我们可以看到。

2、JSON各个库之间的效率相差比较大,jackson库和GSON就大概有5-10的差距(这个只做过一次测试,如有误,请大家轻拍)。而GPB只需要一个,没有所谓的多个库的区别。当然这个点只是弄出来凑数的,可以忽略不计哈。

Talk is cheap,Just show me the code。

在程序界,代码永远是王道,下面就直接来代码吧。

上代码前,大家要先下载protobuffer,在这里:

https://code.google.com/p/protobuf/downloads/list

注意,需要下载两个,一个是complier,另外一个是source code,相信这个难不倒大家了,这里略过。

1、首先,GPB是需要有一个类似类定义的文件,叫proto文件 。

我们以学生和老师的例子来进行一个例子:

我们有以下两个文件:student.proto

Java代码

  1. <span style="font-size: 16px;">option java_package = "com.shun";
  2. option java_outer_classname = "StudentProto";
  3. message Student {
  4. required int32 id = 1;
  5. optional string name = 2;
  6. optional int32 age = 3;
  7. }</span>

teacher.proto

Java代码

  1. <span style="font-size: 16px;">import "student.proto";
  2. option java_package = "com.shun";
  3. option java_outer_classname = "TeacherProto";
  4. message Teacher {
  5. required int32 id = 1;
  6. optional string name = 2;
  7. repeated Student student_list = 3;
  8. }</span>

这里我们遇到了一些比较奇怪的东西:

import,int32,repated,required,optional,option等

一个个来吧:

1)import表示引入其他的proto文件

2)required,optional表示字段是否可选,这个决定了该字段有无值的情况下protobuffer会进行什么处理。如果标志了required,但当处理时,该字段没有进行传值,则会报错;如果标志了optional,不传值则不会有什么问题。

3)repeated相信应该都看得懂了,就是是否重复,跟JAVA里面的list类似

4)message就是相当于class了

5)option表示选项,其中的java_package表示包名,即生成JAVA代码时使用的包名,java_outer_classname即为类名,注意这个类名不能跟下面的message中的类名相同。

至于还有其他的选项和相关类型的,请参观官方文档。

2、有了这几个文件,我们能怎么样呢?

记得上面下载的编译器了吧,解压出来,我们得到一个protoc.exe,这当然是windows下的,我没弄其他系统的,有兴趣的同学去折腾下罗。

加到path(加不加可以随便,只是方不方便而已),然后就可以通过上面的文件生成我们需要的类文件了。

protoc --java_out=存放源代码的路径 --proto_path=proto文件的路径 proto具体文件

--proto_path指定的是proto文件的文件夹路径,并不是单个文件,主要是为了import文件查找使用的,可以省略

如我需要把源代码放在D:\protobufferVsJson\src,而我的proto文件存放在D:\protoFiles

那么我的编译命令就是:

protoc --java_out=D:\protobufferVsJson\src

D:\protoFiles\teacher.proto D:\protoFiles\student.proto

注意,这里最后的文件,我们需要指定需要编译的所有文件

编译后可以看到生成的文件。

代码就不贴出来了,太多了。大家可以私下看看,代码里面有一大堆Builder,相信一看就知道是建造者模式了。

这时可以把代码贴到你的项目中了,当然,错误一堆了。

记得我们前面下载的源代码吗?解压它吧,不要手软。然后找到src/main/java/复制其中的一堆到你的项目,当然,你也可以ant或者maven编译,但这两个东西我都不熟,就不献丑了,我还是习惯直接复制到项目中。


代码出错,哈哈,正常。不知道为何,GOOGLE非要留下这么个坑给我们。

翻回到protobuffer目录下的\java看到有个readme.txt了吧,找到一句:

看来看去,感觉这个代码会有点奇怪的,好像错错的感觉,反正我是没按那个执行,我的命令是:

Java代码

  1. <span style="font-size: 16px;">protoc --java_out=还是上面的放代码的地方 proto文件的路径(这里是descriptor.proto文件的路径)</span>

执行后,我们可以看到代码中的错误木有了。

3、接下来当然就是测试了。

我们先进行GPB写入测试:

Java代码

  1. <span style="font-size: 16px;">package com.shun.test;
  2. import java.io.FileOutputStream;
  3. import java.io.IOException;
  4. import java.util.ArrayList;
  5. import java.util.List;
  6. import com.shun.StudentProto.Student;
  7. import com.shun.TeacherProto.Teacher;
  8. public class ProtoWriteTest {
  9. public static void main(String[] args) throws IOException {
  10. Student.Builder stuBuilder = Student.newBuilder();
  11. stuBuilder.setAge(25);
  12. stuBuilder.setId(11);
  13. stuBuilder.setName("shun");
  14. //构造List
  15. List<Student> stuBuilderList = new ArrayList<Student>();
  16. stuBuilderList.add(stuBuilder.build());
  17. Teacher.Builder teaBuilder = Teacher.newBuilder();
  18. teaBuilder.setId(1);
  19. teaBuilder.setName("testTea");
  20. teaBuilder.addAllStudentList(stuBuilderList);
  21. //把gpb写入到文件
  22. FileOutputStream fos = new FileOutputStream("C:\\Users\\shun\\Desktop\\test\\test.protoout");
  23. teaBuilder.build().writeTo(fos);
  24. fos.close();
  25. }
  26. }</span>

我们去看看文件,如无意外,应该是生成了的。

生成了之后,我们肯定要读回它的。

Java代码

  1. <span style="font-size: 16px;">package com.shun.test;
  2. import java.io.FileInputStream;
  3. import java.io.FileNotFoundException;
  4. import java.io.IOException;
  5. import com.shun.StudentProto.Student;
  6. import com.shun.TeacherProto.Teacher;
  7. public class ProtoReadTest {
  8. public static void main(String[] args) throws FileNotFoundException, IOException {
  9. Teacher teacher = Teacher.parseFrom(new FileInputStream("C:\\Users\\shun\\Desktop\\test\\test.protoout"));
  10. System.out.println("Teacher ID:" + teacher.getId() + ",Name:" + teacher.getName());
  11. for (Student stu:teacher.getStudentListList()) {
  12. System.out.println("Student ID:" + stu.getId() + ",Name:" + stu.getName() + ",Age:" + stu.getAge());
  13. }
  14. }
  15. }</span>

代码很简单,因为GPB生成的代码都帮我们完成了。

上面知道基本的用法了,我们重点来关注GPB跟JSON生成文件大小的区别,JSON的详细代码我这里就不贴了,之后会贴出示例,大家有兴趣可以下载。

这里我们用Gson来解析JSON,下面只给出对象转换成JSON后写出文件的代码:

两个类Student和Teacher的基本定义就不弄了,大家随意就行,代码如下:

Java代码

  1. <span style="font-size: 16px;">package com.shun.test;
  2. import java.io.FileWriter;
  3. import java.io.IOException;
  4. import java.util.ArrayList;
  5. import java.util.List;
  6. import com.google.gson.Gson;
  7. import com.shun.Student;
  8. import com.shun.Teacher;
  9. public class GsonWriteTest {
  10. public static void main(String[] args) throws IOException {
  11. Student stu = new Student();
  12. stu.setAge(25);
  13. stu.setId(22);
  14. stu.setName("shun");
  15. List<Student> stuList = new ArrayList<Student>();
  16. stuList.add(stu);
  17. Teacher teacher = new Teacher();
  18. teacher.setId(22);
  19. teacher.setName("shun");
  20. teacher.setStuList(stuList);
  21. String result = new Gson().toJson(teacher);
  22. FileWriter fw = new FileWriter("C:\\Users\\shun\\Desktop\\test\\json");
  23. fw.write(result);
  24. fw.close();
  25. }
  26. }</span>

接下来正式进入我们的真正测试代码了,前面我们只是在列表中放入一个对象,接下来,我们依次测试100,1000,10000,100000,1000000,5000000这几个数量的GPB和JSON生成的文件大小。

改进一下之前的GPB代码,让它生成不同数量的列表,再生成文件:

Java代码

  1. <span style="font-size: 16px;">package com.shun.test;
  2. import java.io.FileOutputStream;
  3. import java.io.IOException;
  4. import java.util.ArrayList;
  5. import java.util.List;
  6. import com.shun.StudentProto.Student;
  7. import com.shun.TeacherProto.Teacher;
  8. public class ProtoWriteTest {
  9. public static final int SIZE = 100;
  10. public static void main(String[] args) throws IOException {
  11. //构造List
  12. List<Student> stuBuilderList = new ArrayList<Student>();
  13. for (int i = 0; i < SIZE; i ++) {
  14. Student.Builder stuBuilder = Student.newBuilder();
  15. stuBuilder.setAge(25);
  16. stuBuilder.setId(11);
  17. stuBuilder.setName("shun");
  18. stuBuilderList.add(stuBuilder.build());
  19. }
  20. Teacher.Builder teaBuilder = Teacher.newBuilder();
  21. teaBuilder.setId(1);
  22. teaBuilder.setName("testTea");
  23. teaBuilder.addAllStudentList(stuBuilderList);
  24. //把gpb写入到文件
  25. FileOutputStream fos = new FileOutputStream("C:\\Users\\shun\\Desktop\\test\\proto-" + SIZE);
  26. teaBuilder.build().writeTo(fos);
  27. fos.close();
  28. }
  29. }</span>

这里的SIZE依次改成我们上面据说的测试数,可以得到如下:


 然后我们再看看JSON的测试代码:

Java代码

  1. <span style="font-size: 16px;">package com.shun.test;
  2. import java.io.FileWriter;
  3. import java.io.IOException;
  4. import java.util.ArrayList;
  5. import java.util.List;
  6. import com.google.gson.Gson;
  7. import com.shun.Student;
  8. import com.shun.Teacher;
  9. public class GsonWriteTest {
  10. public static final int SIZE = 100;
  11. public static void main(String[] args) throws IOException {
  12. List<Student> stuList = new ArrayList<Student>();
  13. for (int i = 0; i < SIZE; i ++) {
  14. Student stu = new Student();
  15. stu.setAge(25);
  16. stu.setId(22);
  17. stu.setName("shun");
  18. stuList.add(stu);
  19. }
  20. Teacher teacher = new Teacher();
  21. teacher.setId(22);
  22. teacher.setName("shun");
  23. teacher.setStuList(stuList);
  24. String result = new Gson().toJson(teacher);
  25. FileWriter fw = new FileWriter("C:\\Users\\shun\\Desktop\\test\\json" + SIZE);
  26. fw.write(result);
  27. fw.close();
  28. }
  29. }</span>

同样的方法修改SIZE,并作相应的测试。

可以明显得看到json的文件大小跟GPB的文件大小在数据量慢慢大上去的时候就会有比较大的差别了,JSON明显要大上许多。


上面的表应该可以看得比较清楚了,在大数据的GPB是非常占优势的,但一般情况下客户端和服务端并不会直接进行这么大数据的交互,大数据主要发生在服务器端的传输上,如果你面对需求是每天需要把几百M的日志文件传到另外一台服务器,那么这里GPB可能就能帮你的大忙了。

说是深度对比,其实主要对比的是大小方面,时间方面可比性不会太大,也没相差太大。

文章中选择的Gson解析器,有兴趣的朋友可以选择Jackson或者fastjson,又或者其他的,但生成的文件大小是一样的,只是解析时间有区别。

这神一般的iteye博客编辑器,无语了,插入代码后还要带些标签,大家将就看吧。代码就打包在下面了。

Protobuffer和json深度对比相关推荐

  1. 国内十大活跃报表 BI 产品深度对比及点评

    国内十大活跃报表 BI 产品深度对比及点评 目前国内市场上的报表 BI 工具琳琅满目,看起来也各有特点,这给选型工作带来了一些困扰,本文就一些较活跃的报表 BI 产品进行点评,对于不太熟悉这些产品和技 ...

  2. 三星手机Android9和10的区别,三星Galaxy S10+ VS 小米9 拍照深度对比评测:神仙打架...

    三星Galaxy S10+ VS 小米9 拍照深度对比评测:神仙打架 2019-03-05 10:34:10 149点赞 133收藏 435评论 三星S10+和小米9都是最近刚刚发布的旗舰手机,我们也 ...

  3. 深度对比Apache CarbonData、Hudi和Open Delta三大开源数据湖方案

    摘要:今天我们就来解构数据湖的核心需求,同时深度对比Apache CarbonData.Hudi和Open Delta三大解决方案,帮助用户更好地针对自身场景来做数据湖方案选型. 背景 我们已经看到, ...

  4. 在线JSON在线对比差异工具

    在线JSON在线对比差异工具 在线JSON在线对比差异工具 JSON在线对比差异工具,JSON在线对比差异工具,JSON在线对比差异工具 https://tooltt.com/json-diff/

  5. Java kryo/protobuf/protostuff序列化 or Json 性能对比

    Java kryo/protobuf/protostuff序列化 or Json 性能对比 - 腾飞的鹰 - 博客园 对于一个java object的序列化,想测一下使用json和使用一般序列化工具, ...

  6. 以云数据库产品为例深度对比分析:华为云更安全还是阿里云更安全?

    以云数据库产品为例深度对比分析:华为云更安全还是阿里云更安全? 博主介绍 目前市场云 阿里云 阿里云云原生关系型数据库 PolarDB MySQL引擎 什么是PolarDB 产品优势 产品架构 一写多 ...

  7. 深度对比Soul、觅伊,两款社交软件区别在哪?

    (2000字长文,深度对比,让大家了解的更为透彻!) 随着时代的发展,科技的进步,手机在我们的生活中扮演着越来越重要的角色.基本上是机不离身,吃饭要玩会手机,上卫生间要玩会手机,甚至走路也要玩会手机. ...

  8. 为什么我们放弃了 Vue?Vue 和 React 深度对比

    我使用 Vue 和 React 已经很长一段时间了,两个框架上实践代码量都在 10 万行以上.不得不说两者都是很 nice 的,帮助开发者减少很多工作量,这类框架是现代化前端开发必备的.然而 Vue ...

  9. 机器人自动化《RPA国内外平台深度对比》

    RPA国内外平台深度对比,开源项目和二开可行性分析 调研背景 国内平台 艺赛旗 UiBot 云扩 容智 ibot 国外平台 UiPath Microsoft Power Automate RPA 开源 ...

最新文章

  1. Flameshot:Linux 环境下的一个简洁但功能丰富的截图工具
  2. mod_jk是Apache服务器的一个可插入模块
  3. latex参考文献Bib Tex的使用
  4. 杭电1171(01背包求解)
  5. golang mac 环境变量_macOS 配置 golang 运行环境
  6. 递归函数斐波那契数列python_使用Python函数递归实现斐波那契数列时为什么运行速度很慢?...
  7. iOS底层探索之Block(五)——Block源码分析(__block 底层都做了什么?)
  8. paip.不同目录结构哈的文件批量比较
  9. 文件格式的幻数File Format and Magic Number
  10. HTML排版一首古诗,古诗句排版正确方式
  11. 删除bootcamp后扩充Mac分区
  12. gyp ERR! stack Error: EACCES: permission denied,解决
  13. html让登录框3d,CSS3实现3D旋转动态显示登录注册
  14. 纽约大学理工学院:MULTIMEDIA SIGNAL COMPRESSION: SPEECH AND
  15. 麒麟信安天机存储加密系统——国家密码管理局商用密码认证产品
  16. 苹果发布黄色版 iPhone 14,定价 5999 元起;大神李沐被曝离职投身大模型创业;Atlassian 裁员 |极客头条
  17. c语言编程 遍历字符串,请教大家一个C语言面试的编程题目 C语言:循环执行让用户输入一串字符串,如123456789......
  18. 微前端应用及基于qiankun的微前端实践
  19. gedit的安装及插件使用
  20. 字符串的方法练习------Python篇

热门文章

  1. 利用https实现站点的访问
  2. 通过ajax传值,出现的乱码和特殊字符问题
  3. 数据传输优化篇之:scp 或 rsync+ssh 参数优化
  4. java程序员饱和了吗?
  5. NLP之---word2vec算法skip-gram原理详解
  6. android 自定义加载动画效果,Android 自定义View修炼-自定义加载进度动画LoadingImageView...
  7. Partition Array by Odd and Even
  8. crazyradio焊接和下载固件过程
  9. 正则表达式之量词(重复出现)?、*、+
  10. CentOS设置永久静态路由