序列化和反序列化的概念

讨论了为什么Optional不可序列化以及如何处理(即将推出)之后,让我们仔细看看序列化。

总览

这篇文章介绍了序列化的一些关键概念。 它尝试精简地执行此操作,而不会涉及太多细节,包括将建议降至最低。 它没有叙述,更类似于Wiki文章。 主要信息来源是约书亚·布洛赫(Joshua Bloch)的出色著作《 有效的Java》 ,其中涉及到序列化的多个内容(第一版:54-57;第二版: 74-78 )。 在官方序列化规范中可以找到更多信息的方式

定义

通过序列化,实例可以被编码为字节流(称为序列化 ),并且这样的字节流可以被转换回实例(称为反序列化 )。

关键功能是两个进程不必由同一JVM执行。 这使得序列化成为一种在系统运行之间将对象存储在磁盘上或在不同系统之间传输它们以进行远程通信的机制。

语言外特征

序列化是一种有些奇怪的机制。 它将实例转换为字节流,反之亦然,与类的交互很少。 它既不调用访问器来获取值,也不使用构造函数创建实例。 为此,该类的所有开发人员所需要做的就是实现一个没有方法的接口。

Bloch将其描述为一种语言学特征 ,它是序列化中许多问题的根源。

方法

可以通过实现以下某些方法来自定义序列化过程。 它们可以是私有的,JVM将根据其签名来找到它们。 这些描述摘自Serializable的类注释 。

  • private void writeObject(java.io.ObjectOutputStream out) throws IOException
    负责为其特定类编写对象的状态,以便相应的readObject方法可以还原它。
  • private void readObject(java.io.ObjectInputStream in) throws IOException, ClassNotFoundException
    负责从流中读取并还原类字段。
  • private void readObjectNoData() throws ObjectStreamException
    在序列化流未将给定类列出为要反序列化的对象的超类的情况下,负责为其特定类初始化对象的状态。
  • ANY-ACCESS-MODIFIER Object writeReplace() throws ObjectStreamException
    指定将此类的对象写入流时要使用的替代对象。
  • ANY-ACCESS-MODIFIER Object readResolve() throws ObjectStreamException;
    从流中读取此类的实例时,指定一个替换对象。

处理反序列化的语言外特性的一种好方法是将所有涉及的方法视为该类的附加构造函数。

(反)序列化涉及的对象流提供了以下有用的默认(反)序列化方法:

  • java.io.ObjectOutputStream.defaultWriteObject() throws IOException
    将当前类的非静态和非瞬态字段写入此流。
  • java.io.ObjectInputStream.defaultReadObject() throws IOException, ClassNotFoundException
    从此流中读取当前类的非静态和非瞬态字段。

不变量

不使用构造函数创建实例的一种效果是,在反序列化时不会自动建立类的不变式。 因此,尽管类通常会检查所有构造函数参数的有效性,但该机制不会自动应用于字段的反序列化值。

进行反序列化检查是一项额外的工作,很容易导致代码重复及其通常会引起的所有问题。 如果忘记或粗心地做,该类将打开漏洞或安全漏洞。

序列化表格

由infocux Technologies在CC-BY-NC 2.0下发布 。

可序列化类的字节流编码的结构称为其序列化形式 。 它主要由类字段的名称和类型定义。

序列化的表单具有一些不立即可见的属性。 尽管可以通过仔细定义表格来缓解某些有问题的问题,但它们通常仍然是班级未来发展的负担。

公开API

序列化表格的最重要属性是:

它是该类的公共API的一部分!

从部署可序列化类的那一刻起,必须假定已存在序列化实例。 通常期望系统支持使用同一系统的较早版本创建的实例的反序列化。 类的用户依赖于其序列化形式以及其记录的行为。

减少信息隐藏

信息隐藏的概念允许类在更改其实现方式的同时保留其记录的行为。 这包括其状态的表示,通常是隐藏的,可以根据需要进行调整。 由于捕获状态表示形式的序列化形式成为公共API的一部分,因此表示形式本身也是如此。

Serializable类只有有效地隐藏其行为的实施,同时暴露出该行为的界定国家使用它来实现它。

灵活性降低

因此,就像更改类的API(例如,通过更改或删除方法或更改其记录的行为)一样,使用它可能会破坏代码,更改序列化形式也是如此。 不难发现,如果固定领域,提高班级就变得更加困难。 如果需要,这大大降低了更改此类的灵活性。

在JDK可序列化中进行处理会使我们的维护成本急剧增加,因为这意味着该表示将一直冻结。 这限制了我们将来开发实现的能力,而我们无法轻松修复错误或提供增强功能的情况数量非常之多,而这种情况本来就很简单。 因此,尽管对您来说,这看起来像是一个“可序列化的实现”的简单问题,但不仅限于此。 解决早期的选择以使某些东西可序列化所消耗的工作量是惊人的。 布赖恩·格茨

增加测试工作量

如果更改了可序列化的类,则必须测试序列化和反序列化是否可以在系统的不同版本中工作。 这不是一件容易的事,并且会产生可衡量的成本。

类表示

from的序列化表示一个类,但并非所有表示都相等。

物理

如果一个类使用引用类型(即非基本类型)定义字段,则其实例包含指向这些类型的实例的指针。 这些实例又可以指向其他实例,依此类推。 这定义了互连实例的有向图。 实例的物理表示形式是从该实例可到达的所有实例的图形。

例如,考虑一个双向链表。 列表中的每个元素都包含在一个节点中,并且每个节点都知道上一个和下一个。 这基本上已经是列表的物理表示形式。 包含一打元素的列表将是13个节点的图形。 列表实例指向第一个列表节点和最后一个列表节点,从那里可以在两个方向之间遍历这十个节点。

序列化类实例的一种方法是简单地遍历图并序列化每个实例。 这有效地将物理表示形式写入字节流,这是默认的序列化机制。

虽然类的物理表示形式通常是实现细节,但是以这种方式对其进行序列化会暴露此隐藏信息。 序列化物理表示有效地将类绑定到该类,这使得将来很难更改它。 还有其他缺点,在有效Java (第2版的第297页)中进行了介绍。

逻辑上

类状态的逻辑表示通常更抽象。 通常从实施细节中将其删除,并且包含的​​信息较少。 在尝试表达此表示形式时,建议将两个方面都推到最大。 它应该尽可能地独立于实现,并且从某种意义上讲应该是最小的,因为遗漏了任何信息使得无法从中重新创建实例。

继续链接列表的示例,请考虑链接列表的实际含义:仅按特定顺序排列一些元素。 这些是否包含在节点中以及这些假想的节点如何链接都无关紧要。 因此,最小的逻辑表示将仅由那些元素组成。 (为了从流中正确地重新创建实例,有必要添加元素的数量。虽然这是多余的信息,但似乎并没有太大的伤害。)

因此,良好的逻辑表示形式只能捕获状态的抽象结构,而不能捕获表示状态的具体字段。 这意味着尽管改变前者仍然存在问题,但后者可以自由发展。 与序列化物理表示相比,这为类的进一步开发恢复了很大一部分灵活性。

序列化模式

至少有三种方法可以序列化一个类。 称呼所有这些模式都有些过头,因此该术语被宽松地使用。

默认序列化表格

这就像在声明中添加implements Serializable一样简单。 然后,序列化机制会将所有非临时字段写入流,并在反序列化时将流中存在的所有值分配给它们的匹配字段。

这是序列化类的最直接的方法。 这也是序列化所有尖锐的边缘都变得平淡无奇,并等待它们转而真正伤害您的地方。 序列化的形式捕获物理表示,并且绝对不检查不变量。

自定义序列化表格

通过实现writeObject一个类可以定义将哪些内容写入字节流。 匹配的readObject必须读取相应的流,并使用该信息将值分配给字段。

这种方法比默认形式具有更大的灵活性,可用于序列化类的逻辑表示。 有一些细节需要考虑,我只能建议阅读Effective Java中的相应项目(第1版中的项目55;第2版中的项目75)。

序列化代理模式

在这种情况下,要序列化的实例将替换为代理。 该代理是从字节流而不是原始实例写入和读取的。 这可以通过实现方法writeReplacereadResolve来实现。

在大多数情况下,这是迄今为止最好的序列化方法。 它值得自己的职位 ,它会很快得到它( 住宿 调整 )。

杂项

有关序列化的其他一些细节。

人工字节流

反序列化的快乐路径假定一个字节流是通过序列化同一类的实例创建的。 尽管在大多数情况下这样做是可以的,但是在安全关键代码中必须避免这样做。 这包括任何使用序列化进行远程通信的公共可访问服务。

取而代之的是,必须假设攻击者精心制作了流,以违反类的不变式。 如果不解决此问题,则可能导致系统不稳定,从而可能崩溃,破坏数据或受到攻击。

文献资料

Javadoc具有特殊的注释,用于记录类的序列化形式。 为此,它在文档中创建了一个特殊页面,其中列出了以下信息:

  • 标记@serialData可以注释方法,下面的注释应该用来记录字节流中写入的数据。 方法签名和注释显示在“ 序列化方法”下
  • 标记@serial可以注释字段,下面的注释应该描述字段。 然后,该字段的类型和名称以及注释会在“ 序列化字段”下列出

一个很好的例子是LinkedList的文档 。

翻译自: https://www.javacodegeeks.com/2015/01/concepts-of-serialization.html

序列化和反序列化的概念

序列化和反序列化的概念_序列化的概念相关推荐

  1. 序列化与反序列化的单例模式_序列化代理模式

    序列化与反序列化的单例模式 在上一篇文章中 ,我谈到了一般的序列化. 这是更加集中的内容,并提供了一个细节: 序列化代理模式 . 这是处理序列化中许多问题的一种好方法,通常是最好的方法. 如果开发人员 ...

  2. java中序列化与反序列化_Java中的序列化

    java中序列化与反序列化 Java提供了一种称为序列化的机制,以按字节的有序或字节序列的形式持久化Java对象,其中包括对象的数据以及有关对象的类型和存储在对象中的数据类型的信息. 因此,如果我们已 ...

  3. python序列化和反序列化ppt_老生常谈Python序列化和反序列化

    通过将对象序列化可以将其存储在变量或者文件中,可以保存当时对象的状态,实现其生命周期的延长.并且需要时可以再次将这个对象读取出来.Python中有几个常用模块可实现这一功能. pickle模块 存储在 ...

  4. mysql 临时表 概念_临时表的概念

    union all只是合并查询结果,并不会进行去重和排序操作,在没有去重的前提下,使用union all的执容行效率要比union高 一.临时表的概念 在我们操作的表数据量庞大而且又要关联其他表进行查 ...

  5. 土地利用覆被变化的概念_欠压实概念极其荒谬

    ●李传亮 地表疏松的沉积物,孔隙度极高,有时可高达80%以上,但随着埋藏深度的加大,在上覆压力的作用下,其排列方式不断由松散排列趋于致密排列,同时伴随有孔隙度的大幅度减小,此即岩石的压实阶段(I). ...

  6. python面向对象的基本概念_面向对象的概念和基本语法,python,学习,笔记,一,基础...

    一.概念 1. 特点 :注重对象和职责,不同的对象承担不同的职责.更大的封装,在一个对象中封装多个方法. 2. 类 : (1)创建 对象 的,包含属性和方法.先有类,再有对象.不同对象之间的属性可能不 ...

  7. [RabbitMQ]RabbitMQ概念_四大核心概念

    RabbitMQ RabbitMQ 的概念 RabbitMQ 是一个消息中间件:它接受并转发消息.你可以把它当做一个快递站点,当你要发送一个包裹时,你把你的包裹放到快递站,快递员最终会把你的快递送到收 ...

  8. 单片机外设基本概念_单片机基本概念

    作者 : 佚名 来源 : 本站原创 点击数 : 更新时间: 2007 年 08 月 14 日 [字体:大 中 小] 随着电子技术的迅速发展,计算机已深入地渗透到我们的生活中,许多电子爱好者开始 学习单 ...

  9. mysql中端口的概念_端口的概念,端口的分类

    端口概念 在网络技术中,端口(Port)大致有两种意思:一是物理意义上的端口,比如,ADSL Modem.集线器.交换机.路由器用于连接其他网络设备的接口,如RJ-45端口.SC端口等等.二是逻辑意义 ...

最新文章

  1. 2021年人工神经网络第一次作业要求
  2. 【体验】ESP32-CAM可能是最便宜的“监控”方案,ESP32-CAM程序下载调试
  3. String 与StringBuilder
  4. 如何在本地连接服务器上的MySQL
  5. mybatis进行CRUD操作时返回值不为影响的条数,为null
  6. python日期对照表_2020年日期表-python实现
  7. MIT新研究:基于基本运动能力让机器人自主学习,感知世界
  8. python和java选择哪个-python和Java选择哪一个?
  9. iovec结构体定义及使用 (转)
  10. c++fabs函数_支持向量机(SVM)模型python复现 - SMO算法;核技巧;高斯核函数
  11. 手写RPC(五) 核心模块网络协议模块编写 ---- 自定义协议
  12. wave overfly
  13. Eclipse 下载,安装,配置教程
  14. 大咖说*计算讲谈社|不止能上路,更能做好服务:自动驾驶产品规模化的问题定义
  15. 西工大java高级网络编程_西工大16春《JAVA高级网络编程》平时作业
  16. Testin徐琨:颠覆测试行业的四个必杀技
  17. 【每天学点管理】——RACI责任制(快速解决责任分配问题)
  18. WMS系统的功能,业务和定义
  19. 亚马逊国际站获取商品列表
  20. h5物体拖动_【点我解锁】11种网易爆款H5交互手势及案例

热门文章

  1. 【2018.4.7】模拟赛之一-ssl2382 K好数【数位dp】
  2. 【拓扑排序】【DP】奖金(ssl 1325)
  3. 【并查集】黑魔法师之门(codevs 1995/joyoi-codevs 1995)
  4. 【动态规划】最小代价问题
  5. CF732F Tourist Reform(dfs树、边双连通图、tarjan)
  6. 2017西安交大ACM小学期数论 [水题]
  7. SQL正在击败NoSQL,这对未来的数据意味着什么
  8. 谈谈Memcached与Redis
  9. 2018年不能错过的 14 个 Java 库
  10. springboot+layui从控制器请求至页面时js失效的解决方法