概述

Java中的对象的内部状态只保存在内存中,其生命周期最长与JVM的生命周期一样,即JVM停止之后,所有对象都会被销毁。但有时候,Java对象是需要持久化的,因此Java提供了一种对象持久化方式——对象序列化机制(Object serialization),可以很容易的在JVM中的活动对象和字节数组(流)之间进行转换。

对象序列化保存的是对象的”状态”,即它的成员变量。由此可知,对象序列化不会关注类中的静态变量。

除了在持久化对象时会用到对象序列化之外,当使用RMI(远程方法调用),或在网络中传递对象时,都会用到对象序列化。

注意:序列化的是对象(对象的状态,成员变量等),而不是类

简单示例

package java_interview;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.ObjectInputStream;
import java.io.ObjectOutputStream;
import java.io.Serializable;
import java.lang.reflect.Field;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.HashSet;
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import java.util.NavigableMap;
import java.util.Random;
import java.util.Scanner;
import java.util.TreeMap;
import java.util.TreeSet;
public class Test {public static void main(String[] args) throws Exception {}
}enum Gender {MALE, FEMALE
}
class Person implements Serializable {private String name = null;private Integer age = null;private Gender gender = null;public Person() {System.out.println("none-arg constructor");}public Person(String name, Integer age, Gender gender) {System.out.println("arg constructor");this.name = name;this.age = age;this.gender = gender;}public String getName() {return name;}public void setName(String name) {this.name = name;}public Integer getAge() {return age;}public void setAge(Integer age) {this.age = age;}public Gender getGender() {return gender;}public void setGender(Gender gender) {this.gender = gender;}@Overridepublic String toString() {return "[" + name + ", " + age + ", " + gender + "]";}
}
public class SimpleSerial {public static void main(String[] args) throws Exception {File file = new File("person.out");ObjectOutputStream oout = new ObjectOutputStream(new FileOutputStream(file));Person person = new Person("John", 101, Gender.MALE);oout.writeObject(person);oout.close();ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file));Object newPerson = oin.readObject(); // 没有强制转换到Person类型oin.close();System.out.println(newPerson);}
}
/*输出:
arg constructor
[John, 101, MALE]*/

此时必须注意的是,当重新读取被保存的Person对象时,并没有调用Person的任何构造器,看起来就像是直接使用字节将Person对象还原出来的。

当Person对象被保存到person.out文件中之后,我们可以在其它地方去读取该文件以还原对象,但必须确保该读取程序的CLASSPATH中包含有Person.class(哪怕在读取Person对象时并没有显示地使用Person类,如上例所示),否则会抛出ClassNotFoundException。

Serializable的作用

什么一个类实现了Serializable接口,它就可以被序列化呢?在上节的示例中,使用ObjectOutputStream来持久化对象,在该类中有如下代码:

private void writeObject0(Object obj, boolean unshared) throws IOException {if (obj instanceof String) {writeString((String) obj, unshared);} else if (cl.isArray()) {writeArray(obj, desc, unshared);} else if (obj instanceof Enum) {writeEnum((Enum) obj, desc, unshared);} else if (obj instanceof Serializable) {writeOrdinaryObject(obj, desc, unshared);} else {if (extendedDebugInfo) {throw new NotSerializableException(cl.getName() + "\n"+ debugInfoStack.toString());} else {throw new NotSerializableException(cl.getName());}}}

从上述代码可知,如果被写对象的类型是String,或数组,或Enum,或Serializable,那么就可以对该对象进行序列化,否则将抛出NotSerializableException。

默认序列化机制

如果仅仅只是让某个类实现Serializable接口,而没有其它任何处理的话,则就是使用默认序列化机制。

默认的序列化机制,是对对象的所有成员变量(静态变量不会被序列化,因为它不属于某个对象,是所有对象共享的)进行序列化

使用默认机制,在序列化对象时,不仅会序列化当前对象本身,还会对该对象引用的其它对象也进行序列化,同样地,这些其它对象引用的另外对象也将被序列化,以此类推。所以,如果一个对象包含的成员变量是容器类对象,而这些容器所含有的元素也是容器类对象,那么这个序列化的过程就会较复杂,开销也较大。

影响序列化

在现实应用中,有些时候不能使用默认序列化机制。比如,希望在序列化过程中忽略掉敏感数据,或者简化序列化过程。下面将介绍若干影响序列化的方法。

transient关键字

有些情况下,是不希望对象的所有成员变量都进行序列化,比如User中的passwd字段,这个是敏感数据,不希望它被序列化,那么就可以使用transient关键字。
transient,顾名思义,非持久化的。使用transient关键字修饰成员变量,能够使它在序列化的过程中被忽略。

此处将Person类中的age字段声明为transient,如下所示,

public class Person implements Serializable {transient private Integer age = null;}

再执行SimpleSerial应用程序,会有如下输出:

arg constructor
[John, null, MALE]

* writeObject()方法与readObject()方法*

对于上述已被声明为transitive的字段age,除了将transitive关键字去掉之外,是否还有其它方法能使它再次可被序列化?方法之一就是在Person类中添加两个方法:writeObject()与readObject(),如下所示:

public class Person implements Serializable {transient private Integer age = null;private void writeObject(ObjectOutputStream out) throws IOException {out.defaultWriteObject();out.writeInt(age);}private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {in.defaultReadObject();age = in.readInt();}
}

在writeObject()方法中会先调用ObjectOutputStream中的defaultWriteObject()方法,该方法会执行默认的序列化机制,如5.1节所述,此时会忽略掉age字段。然后再调用writeInt()方法显示地将age字段写入到ObjectOutputStream中。readObject()的作用则是针对对象的读取,其原理与writeObject()方法相同。

再次执行SimpleSerial应用程序,则又会有如下输出:

arg constructor
[John, 31, MALE]

必须注意地是,writeObject()与readObject()都是private方法,那么它们是如何被调用的呢?毫无疑问,是使用反射。详情可见ObjectOutputStream中的writeSerialData方法,以及ObjectInputStream中的readSerialData方法。

通过这两个方法,可以对特殊要求的字段,增加额外的加密,解密的代码

Externalizable接口

以上例子都是基于实现Serializable接口来实现序列化的,Externalizable接口继承于Serializable,通过实现Externalizable接口也能实现序列化,不同的是,序列化操作的细节需要自己实现,而且,必须提供public的无参构造函数,否则会出现以下错误:

无论是使用transient关键字,还是使用writeObject()和readObject()方法,其实都是基于Serializable接口的序列化。JDK中提供了另一个序列化接口–Externalizable,使用该接口之后,之前基于Serializable接口的序列化机制就将失效。此时将Person类修改成如下,

public class Person implements Externalizable {private String name = null;transient private Integer age = null;private Gender gender = null;public Person() {System.out.println("none-arg constructor");}public Person(String name, Integer age, Gender gender) {System.out.println("arg constructor");this.name = name;this.age = age;this.gender = gender;}private void writeObject(ObjectOutputStream out) throws IOException {out.defaultWriteObject();out.writeInt(age);}private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {in.defaultReadObject();age = in.readInt();}@Overridepublic void writeExternal(ObjectOutput out) throws IOException {}@Overridepublic void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {}}

此时再执行SimpleSerial程序之后会得到如下结果:

arg constructor
none-arg constructor
[null, null, null]

从该结果,一方面可以看出Person对象中任何一个字段都没有被序列化。另一方面,如果细心的话,还可以发现这此次序列化过程调用了Person类的无参构造器。

另外,若使用Externalizable进行序列化,当读取对象时,会调用被序列化类的无参构造器去创建一个新的对象,然后再将被保存对象的字段的值分别填充到新对象中。这就是为什么在此次序列化过程中Person类的无参构造器会被调用。由于这个原因,实现Externalizable接口的类必须要提供一个无参的构造器,且它的访问权限为public。

对上述Person类作进一步的修改,使其能够对name与age字段进行序列化,但要忽略掉gender字段,如下代码所示:

public class Person implements Externalizable {private String name = null;transient private Integer age = null;private Gender gender = null;public Person() {System.out.println("none-arg constructor");}public Person(String name, Integer age, Gender gender) {System.out.println("arg constructor");this.name = name;this.age = age;this.gender = gender;}private void writeObject(ObjectOutputStream out) throws IOException {out.defaultWriteObject();out.writeInt(age);}private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {in.defaultReadObject();age = in.readInt();}@Overridepublic void writeExternal(ObjectOutput out) throws IOException {out.writeObject(name);out.writeInt(age);}@Overridepublic void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {name = (String) in.readObject();age = in.readInt();}}

执行SimpleSerial之后会有如下结果:

arg constructor
none-arg constructor
[John, 31, null]

可知:采用这种方法实现序列化,transient是不起作用的,如果你不想序列化某个成员变量,只要在readExternal和writeExternal中不对该变量进行相应操作就可以了。

readResolve()方法

当我们使用Singleton模式时,应该是期望某个类的实例应该是唯一的,但如果该类是可序列化的,那么情况可能会略有不同。此时对第2节使用的Person类进行修改,使其实现Singleton模式,如下所示:

public class Person implements Serializable {private static class InstanceHolder {private static final Person instatnce = new Person("John", 31, Gender.MALE);}public static Person getInstance() {return InstanceHolder.instatnce;}private String name = null;private Integer age = null;private Gender gender = null;private Person() {System.out.println("none-arg constructor");}private Person(String name, Integer age, Gender gender) {System.out.println("arg constructor");this.name = name;this.age = age;this.gender = gender;}}

同时要修改SimpleSerial应用,使得能够保存/获取上述单例对象,并进行对象相等性比较,如下代码所示:

public class SimpleSerial {public static void main(String[] args) throws Exception {File file = new File("person.out");ObjectOutputStream oout = new ObjectOutputStream(new FileOutputStream(file));oout.writeObject(Person.getInstance()); // 保存单例对象oout.close();ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file));Object newPerson = oin.readObject();oin.close();System.out.println(newPerson);System.out.println(Person.getInstance() == newPerson); // 将获取的对象与Person类中的单例对象进行相等性比较}
}

执行上述应用程序后会得到如下结果:

arg constructor
[John, 31, MALE]
false

值得注意的是,从文件person.out中获取的Person对象与Person类中的单例对象并不相等。为了能在序列化过程仍能保持单例的特性,可以在Person类中添加一个readResolve()方法,在该方法中直接返回Person的单例对象,如下所示:

public class Person implements Serializable {private static class InstanceHolder {private static final Person instatnce = new Person("John", 31, Gender.MALE);}public static Person getInstance() {return InstanceHolder.instatnce;}private String name = null;private Integer age = null;private Gender gender = null;private Person() {System.out.println("none-arg constructor");}private Person(String name, Integer age, Gender gender) {System.out.println("arg constructor");this.name = name;this.age = age;this.gender = gender;}private Object readResolve() throws ObjectStreamException {return InstanceHolder.instatnce;}}

再次执行本节的SimpleSerial应用后将有如下输出:

arg constructor
[John, 31, MALE]
true

无论是实现Serializable接口,或是Externalizable接口,当从I/O流中读取对象时,readResolve()方法都会被调用到。实际上就是用readResolve()中返回的对象直接替换在反序列化过程中创建的对象,而被创建的对象则会被垃圾回收掉。

总结

  • 实现Serializable与Externalizable接口都可以实现序列化
  • 前者实现方式如果不想序列化某个成员变量,使用transient关键字修饰该成员变量即可;如果想在此基础上添加一些自定义操作,在该类中实现writeObject与readObject方法(注意是private方法),在这两个方法里就可以做一些自定义操作,如改变某个成员变量的值。
  • 后者实现方式,需要自己实现序列的细节(writeExternal与readExternal方法),并且必须提供一个public的无参构造函数。这种方式为自定义序列化提供了更多的灵活性。

高级认识

序列化 ID 问题

情境:

两个客户端 A 和 B 试图通过网络传递对象数据,A 端将对象 C 序列化为二进制数据再传给 B,B 反序列化得到 C。

问题:

C 对象的全类路径假设为 com.inout.Test,在 A 和 B 端都有这么一个类文件,功能代码完全一致。也都实现了 Serializable 接口,但是反序列化时总是提示不成功。

解决:

虚拟机是否允许反序列化,不仅取决于类路径和功能代码是否一致,一个非常重要的一点是两个类的序列化 ID 是否一致(就是 private static final long serialVersionUID = 1L)。清单 1 中,虽然两个类的功能代码完全一致,但是序列化 ID 不同,他们无法相互序列化和反序列化。

清单 1. 相同功能代码不同序列化 ID 的类对比

 package com.inout; import java.io.Serializable; public class A implements Serializable { private static final long serialVersionUID = 1L; private String name; public String getName() { return name; } public void setName(String name) { this.name = name; } } package com.inout; import java.io.Serializable; public class A implements Serializable { private static final long serialVersionUID = 2L; private String name; public String getName() { return name; } public void setName(String name) { this.name = name;

如此问题中情景,客户端A将对象C序列化后,传给客户端B;客户端B对C进行反序列化时,B中必须有C对象对应的类,而且A、B客户端中对于对象C对应的类的序列化 ID 必须一致。

序列化 ID 在 Eclipse 下提供了两种生成策略,一个是固定的 1L,一个是随机生成一个不重复的 long 类型数据(实际上是使用 JDK 工具生成),在这里有一个建议,如果没有特殊需求,就是用默认的 1L 就可以,这样可以确保代码一致时反序列化成功。那么随机生成的序列化 ID 有什么作用呢,有些时候,通过改变序列化 ID 可以用来限制某些用户的使用。

序列化存储规则

ObjectOutputStream out = new ObjectOutputStream(new FileOutputStream("result.obj"));Test test = new Test();//试图将对象两次写入文件out.writeObject(test);out.flush();System.out.println(new File("result.obj").length());out.writeObject(test);out.close();System.out.println(new File("result.obj").length());ObjectInputStream oin = new ObjectInputStream(new FileInputStream("result.obj"));//从文件依次读出两个文件Test t1 = (Test) oin.readObject();Test t2 = (Test) oin.readObject();oin.close();//判断两个引用是否指向同一个对象System.out.println(t1 == t2);
/*
31
36
true
*/

解答:Java 序列化机制为了节省磁盘空间,具有特定的存储规则,当写入文件的为同一对象时,并不会再将对象的内容进行存储,而只是再次存储一份引用,上面增加的 5 字节的存储空间就是新增引用和一些控制信息的空间。反序列化时,恢复引用关系,使得清单 3 中的 t1 和 t2 指向唯一的对象,二者相等,输出 true。该存储规则极大的节省了存储空间。

参考:http://www.blogjava.net/jiangshachina/archive/2012/02/13/369898.html

http://www.jianshu.com/p/56671a839f9c

https://www.ibm.com/developerworks/cn/java/j-lo-serial/

Java基础之对象序列化相关推荐

  1. Java基础:对象序列化详解

    在我们平日开发中,经常让PO类去实现Serializable接口,然后让其可序列化.不过有时我们并不是特别清楚为什么要序列化,特别是对于纯Web项目开发的同学来说,需求环境不一定能用上.下面我简单和大 ...

  2. Java中的对象序列化操作

    文章目录 1 Java中的对象序列化操作 1 Java中的对象序列化操作 首先看一下对象序列化的操作步骤: 创建一个类,继承Serializable接口 创建对象 将对象写入文件 从文件读取对象信息 ...

  3. 【译】Java中的对象序列化

    前言 好久没翻译simple java了,睡前来一篇. 译文链接: http://www.programcreek.com/2014/01/java-serialization/ 什么是对象序列化 在 ...

  4. java 对象构造函数_20.Java基础_对象的构造函数

    package pack1; public class Student { private String name; private int age; //构造方法 //如果没有任何构造函数,系统会自 ...

  5. java基础知识-对象和类

    前言: 因为要准备Java面试,所有将java基础知识点重新复习一遍,主要笔记来源于菜鸟教程和java核心技术的书籍中,也有一些博客上的资料(这些只供我个人学习使用) Java 对象和类 对象:对象是 ...

  6. java 中的对象序列化

    java对象序列化允许你将一个实现了Serializable接口的对象转换成byte,以方便以后的调用.应该在实现了Serializable接口的类内定义  private static final ...

  7. java 反射 transient_JAVA 对象序列化(三)——transient以及Externalizable的一种替代方法(使用Serializable)...

    transient(瞬时)关键字 当我们队序列化进行控制时,可能某个特定子对象不想让Java的序列化机制自动保存与恢复.如果子对象表示的是我们不希望将其序列化的敏感信息(如密码),通常就会面临这种情况 ...

  8. Java基础/利用fastjson序列化对象为JSON

    利用fastjson序列化对象为JSON 参考博客:http://blog.csdn.net/zeuskingzb/article/details/17468079 Step1:定义实体类 //用户类 ...

  9. 吃透Java基础九:序列化

    一:什么是序列化 序列化是将Java对象相关的类信息.属性.属性值等信息以一定的格式转换为字节流,反序列化时再将字节流表示的信息来构建出Java对象.过程中涉及到其它对象的引用对象也要参与序列化. 二 ...

最新文章

  1. mysql 导入sql文件,source命令
  2. 请把下面的列表转换为html,在python中将列表转换为HTML表的最简单方法是什么?...
  3. 【Android开发】之Fragment与Acitvity通信
  4. 暴力破解(一)——python脚本暴力破解 加密的zip压缩文件
  5. java条件运算符类型转换_Java数据类型、运算符及类型转换
  6. HBase跨版本数据迁移总结
  7. 利用Vailyn识别路径遍历和文件包含漏洞
  8. 互联网行业值得关注的10个公众号推荐(附pdf下载)
  9. 基于Java gui的超市管理系统
  10. 虚拟化服务器杀毒软件,虚拟机需要安装杀毒软件吗
  11. mermaid流程图语法教程
  12. 易企秀把作品转赠给别人,让别人可以编辑
  13. js OO写的一个键盘字母游戏
  14. 敲黑板,定积分也有换元和分部积分法!
  15. 102.(leaflet篇)leaflet态势标绘-分队战斗行动修改 (燕尾)
  16. 在oracle数据库中存储数据库的文件是,Oracle数据库,oracle
  17. 《水经注地图服务》图层管理介绍
  18. 面试又双叒叕被问到数据库三大范式,该怎么答才能让面试官认可呢
  19. 漫画:互联网人的十二时辰,程序员最惨!
  20. 基于网络媒介的交互设计研究

热门文章

  1. 计算机电缆试验电压标准,电子计算机用电缆技术参数
  2. 非常牛批的可视化库Plotly
  3. 计算机网络概念、基本组成及用途
  4. PHP 源码加密 (zendGuard和ionCube)
  5. Use our mind for judging truth and error!
  6. WebSocket踩坑:org.java_websocket.exceptions.WebsocketNotConnectedException: null
  7. 借到侯捷译的《Java编程思想》 窃喜中...
  8. 诺泰生物更新IPO招股书:少数股东权益亏损,信息披露违规不断
  9. 5步快速成为牛逼的UI设计师!
  10. 国内园区网络的主要协议/技术+WLAN组网架构