假设您正在开发一个将对象自动保存到数据库中的框架。 您需要检测两次保存之间所做的更改,以便仅保存修改过的字段。 如何检测脏场。 最简单的方法是遍历原始数据和当前数据,并分别比较每个字段。 代码如下:

public static void getDirtyFields(Object obj, Object obj2, Class cls, Map<String, DiffFields> diff)throws Exception {Field[] flds = cls.getDeclaredFields();for (int i = 0; i < flds.length; i++) {flds[i].setAccessible(true);Object fobj = flds[i].get(obj);Object fobj2 = flds[i].get(obj2);if (fobj.equals(fobj2)) continue;if (checkPrimitive(flds[i].getType())) {<!-- add to dirty fields -->continue;}Map<String, DiffFields> fdiffs = new HashMap<String, DiffFields>();getDirtyFields(fobj, fobj2, fobj.getClass(), fdiffs);<!-- add to dirty fields -->}if (cls.getSuperclass() != null)getDirtyFields(obj, obj2, cls.getSuperclass(), diff);}

上面的代码不能处理很多条件,例如空值,字段是集合,映射或数组等。但是,这给出了可以做什么的想法。 如果对象很小并且其中没有太多层次结构,则效果很好。 当在巨大的层次结构对象中的变化很小时,我们必须一直遍历最后一个对象以了解差异。 而且,使用equals可能不是检测脏字段的正确方法。 可能尚未实现等于,或者只是比较了几个字段,所以没有进行真正的脏字段检测。 您必须遍历每个字段,而不论是否相等,直到您击中图元来检测脏字段为止。

在这里,我想谈谈检测脏场的另一种方法。 除了使用反射,我们还可以使用序列化来检测脏字段。 我们可以轻松地替换上面代码中的“等于”来序列化对象,并且仅当字节不同时才继续操作。 但这不是最佳选择,因为我们将多次序列化同一对象。 我们需要如下逻辑:

  • 序列化要比较的两个对象
  • 比较两个字节流时,检测要比较的字段
  • 如果字节值不同,则将该字段存储为不同
  • 收集所有不同的字段并返回

因此,一次遍历两个字节流可以生成不同字段的列表。 我们如何实现这种逻辑? 我们可以遍历序列化流并能够识别其中的字段吗? 我们要编写如下代码:

public static void main(String[] args) throws Exception {ComplexTestObject obj = new ComplexTestObject();ComplexTestObject obj2 = new ComplexTestObject();obj2._simple._string = "changed";//serialize the first object and get the bytesByteArrayOutputStream ostr = new ByteArrayOutputStream();CustomOutputStream str = new CustomOutputStream(ostr);str.writeObject(obj);str.close();byte[] bytes = ostr.toByteArray();//serialize the second object and get the bytesostr = new ByteArrayOutputStream();str = new CustomOutputStream(ostr);str.writeObject(obj2);str.close();byte[] bytes1 = ostr.toByteArray();       //read and compare the bytes and get back a list of differing fieldsReadSerializedStream check = new ReadSerializedStream(bytes, bytes1);Map diff = check.compare();System.out.println("Got difference: " + diff);}

Map应该包含_simple._string,以便我们可以直接转到_string并对其进行处理。

解释序列化格式

有些文章解释了标准序列化字节流的外观 。 但是,我们将使用自定义格式。 虽然我们可以读取标准的序列化格式,但是当类的结构已经由我们的类定义时,就没有必要了。 我们将简化它,并更改序列化的格式以仅写入字段的类型。 字段的类型是必需的,因为类声明可以引用接口,超类等,而所包含的值可以是派生类型。

为了自定义序列化,我们创建自己的ObjectOutputStream并覆盖writeClassDescriptor函数。 现在,我们的ObjectOutputStream如下所示:

public class CustomOutputStream extends ObjectOutputStream {public CustomOutputStream(OutputStream str)throws IOException  {super(str);}@Overrideprotected void writeClassDescriptor(ObjectStreamClass desc)throws IOException  {<b>String name = desc.forClass().getName();writeObject(name);</b>String ldr = "system";ClassLoader l = desc.forClass().getClassLoader();if (l != null)  ldr = l.toString();if (ldr == null)  ldr = "system";writeObject(ldr);}
}

让我们编写一个简单的对象进行序列化,并查看字节流的外观:

public class SimpleTestObject implements java.io.Serializable {int _integer;String _string;public SimpleTestObject(int b)  {_integer = 10;_string = "TestData" + b;}public static void main(String[] args) throws Exception  {SimpleTestObject obj = new SimpleTestObject(0);FileOutputStream ostr = new FileOutputStream("simple.txt");CustomOutputStream str = new CustomOutputStream(ostr);str.writeObject(obj);str.close(); ostr.close();}
}

运行此类后,调用“ hexdump -C simple.txt”,显示以下输出:

00000000  ac ed 00 05 73 72 74 00  10 53 69 6d 70 6c 65 54  |....srt..SimpleT|
00000010  65 73 74 4f 62 6a 65 63   74 74 00 27 73 75 6e 2e  |estObjectt.'sun.|
00000020  6d 69 73 63 2e 4c 61 75  6e 63 68 65 72 24 41 70  |misc.Launcher$Ap|
00000030  70 43 6c 61 73 73 4c 6f   61 64 65 72 40 33 35 63  |pClassLoader@35c|
00000040  65 33 36 78 70 00 00 00  0a 74 00 09 54 65 73 74  |e36xp....t..Test|
00000050  44 61 74 61 30                                                          |Data0|
00000055

按照本文中的格式,我们可以将字节跟踪为:

  • AC ED:STREAM_MAGIC。 指定这是一个序列化协议。
  • 00 05:STREAM_VERSION。 序列化版本。
  • 0×73:TC_OBJECT。 指定这是一个新对象。

现在我们需要阅读类描述符。

  • 0×72:TC_CLASSDESC。 指定这是一个新类。

类描述符是我们编写的,因此我们知道格式。 它已读取两个字符串。

  • 0×74:TC_STRING。 指定对象的类型。
  • 0×00 0×10:字符串的长度,后跟对象类型的16个字符,即SimpleTestObject
  • 0×74:TC_STRING。 指定类加载器
  • 0×00 0×27:字符串的长度,后跟类加载器名称
  • 0×78:TC_ENDBLOCKDATA,对象的可选块数据的结尾。
  • 0×70:TC_NULL,在结束块之后,表示没有超类的事实

此后,将写入类中不同字段的值。 我们的类_integer和_string中有两个字段。 因此我们有4个字节的_integer值,即0×00、0×00、0×00、0x0A,后跟一个格式为字符串的字符串

  • 0×74:TC_STRING
  • 0×00 0×09:字符串的长度
  • 9个字节的字符串数据

比较流并检测脏区

现在我们了解并简化了序列化格式,我们可以开始为流编写解析器并对其进行比较。 首先,我们为原始字段编写标准的读取函数。 例如,如下所示编写getInt以读取整数(示例代码中存在其他整数):

static int getInt(byte[] b, int off) {return ((b[off + 3] & 0xFF) << 0) +  ((b[off + 2] & 0xFF) << 8) +((b[off + 1] & 0xFF) << 16) + ((b[off + 0]) << 24);}

可以使用以下代码读取类描述符。

byte desc = _reading[_readIndex++]; //read TC_CLASSDESCbyte cdesc = _compareTo[_compareIndex++];switch (desc) {case TC_CLASSDESC: {byte what = _reading[_readIndex++];  byte cwhat = _compareTo[_compareIndex++]; //read the type written TC_STRINGif (what == TC_STRING) {String[] clsname = readString(); //read the field Type if (_reading[_readIndex] == TC_STRING) {what = _reading[_readIndex++];  cwhat = _compareTo[_compareIndex++];String[] ldrname = readString(); //read the classloader name}ret.add(clsname[0]);cret.add(clsname[1]);}byte end = _reading[_readIndex++]; byte cend = _compareTo[_compareIndex++]; //read 0x78 TC_ENDBLOCKDATA//we read again so that if there are super classes, their descriptors are also read//if we hit a TC_NULL, then the descriptor is readreadOneClassDesc(); }break;case TC_NULL://ignore all subsequent nulls while (_reading[_readIndex] == TC_NULL) desc = _reading[_readIndex++];while (_compareTo[_compareIndex] == TC_NULL) cdesc = _compareTo[_compareIndex++];break;}

在这里,我们读取第一个字节,如果它是TC_CLASSDESC,则读取两个字符串。 然后,我们继续阅读,直到达到TC_NULL。 还有其他条件要处理,例如TC_REFERENCE,它是对先前声明的值的引用。 可以在示例代码中找到。

注意:函数同时读取两个字节流(_reading和_compareTo)。 因此,他们两个总是指向下一步必须开始比较的地方。 字节被读取为一个块,这确保即使存在值差异,我们也将始终从正确的位置开始。 例如,字符串块的长度指示直到读取的位置,类描述符的末尾指示直到读取的位置,依此类推。

我们尚未编写字段序列。 我们如何知道要阅读哪些字段? 为此,我们可以执行以下操作:

Class cls = Class.forName(clsname, false, this.getClass().getClassLoader());ObjectStreamClass ostr = ObjectStreamClass.lookup(cls);ObjectStreamField[] flds = ostr.getFields();

这为我们提供了序列化顺序的字段。 如果我们遍历flds,则将按照写入数据的顺序进行。 因此,我们可以如下进行迭代:

Map diffs = new HashMap();
for (int i = 0; i < flds.length; i++) {DiffFields dfld = new DiffFields(flds[i].getName());if (flds[i].isPrimitive()) { //read primitivesObject[] read = readPrimitive(flds[i]);if (!read[0].equals(read[1])) diffs.put(flds[i].getName(), dfld); //Value is not the same so add as different}else if (flds[i].getType().equals(String.class)) { //read stringsbyte nxtread = _reading[_readIndex++]; byte nxtcompare = _compareTo[_compareIndex++];String[] rstr = readString();if (!rstr[0].equals(rstr[1])) diffs.put(flds[i].getName(), dfld); //String not same so add as difference}
}

在这里,我仅说明了如何检查类中的原始字段是否存在差异。 但是,可以通过递归调用对象字段类型的相同函数,将逻辑扩展到子类。

您可以在此处找到该博客要尝试的示例代码,该代码具有比较子类和超类的逻辑。 在这里可以找到更整洁的实现。

请注意。 此方法存在一些缺点:

  • 此方法只能使用可序列化的对象和字段。 暂态和静态字段之间没有差异。
  • 如果writeObject覆盖默认的序列化,则ObjectStreamClass不能正确反映序列化的字段。 为此,我们将不得不对这些类的读取进行硬编码。 例如,在示例代码中,存在对ArrayList的读取或使用并解析标准序列化格式。
参考: 使用序列化从JCG合作伙伴 Raji Sankar在Reflections博客上找到对象中的脏区 。

翻译自: https://www.javacodegeeks.com/2013/11/using-serialization-to-find-dirty-fields-in-an-object.html

使用序列化查找对象中的脏字段相关推荐

  1. 最长公共子序列_使用序列化查找对象中的脏字段

    最长公共子序列 假设您正在开发一个将对象自动保存到数据库中的框架. 您需要检测两次保存之间所做的更改,以便仅保存修改的字段. 如何检测脏场. 最简单的方法是遍历原始数据和当前数据,并分别比较每个字段. ...

  2. java对象序列化去掉字段_使用序列化查找对象中的脏字段

    java对象序列化去掉字段 假设您正在开发一个将对象自动保存到数据库中的框架. 您需要检测两次保存之间所做的更改,以便仅保存已修改的字段. 如何检测脏场. 最简单的方法是遍历原始数据和当前数据,并分别 ...

  3. JS在数组对象中添加新字段

    在数组对象中每一项都添加相同字段 第一步使用forEach遍历数组 然后通过Object.assign()来添加 var arr = [{age:18,sex:'女'}, {age:30,sex:'男 ...

  4. 工具方法:一次性将对象中所有null字段,转为空字符串

    当我们的 Java 对象在响应前端,或者在做数据导出的时候,我们并不希望将对象中为 null 的属性值直接返回给前端,不然显示或导出的就是一个 null ,这样对用户不是很友好. 如果我们一个个字段的 ...

  5. 将JSON对象中的某个字段进行分组和排序(java实现)

    现在有这样一个数据 { "systemid": "123", "productid": "123", "dat ...

  6. mongodb 如何删除 字段值为 json对象中的某个字段值

    例如: { attributes: { birthday:'1988-01-01', name: 'aq' } } birthday是attributes字段的value的一个字段, 我要删除birt ...

  7. [SQL] 查找数据库中含有某字段的所有表

    select a.name 表名,b.name 列名 from sysobjects a,syscolumns b where a.id = b.id and b.name = 'selling_pr ...

  8. List中根据对象字段快速查找对象

    import java.lang.reflect.Field; import java.util.ArrayList; import java.util.List; import java.util. ...

  9. java 对象怎么序列化,java对象序列化总结

    java对象序列化小结 百度百科上介绍序列化是这样的: 序列化 (Serialization): 将对象的状态信息转换为可以存储或传输的形式的过程.在序列化期间,对象将其当前状态写入到临时或持久性存储 ...

最新文章

  1. github 思维导图开元软件_画思维导图记笔记的工具软件
  2. python【力扣LeetCode算法题库】104-二叉树的最大深度
  3. java线程池的使用
  4. java.lang.ClassNotFoundException: org.springframework.web.servlet.Dispatcher
  5. iso qemu 安装ubuntu_在 Ubuntu 6.06 上安装 qemu 和 kqemu(zz)
  6. js 实现 复制 功能 (zeroclipboard)
  7. iptables:tproxy做透明代理
  8. com 名字对象(3)使用IMoniker
  9. 折线分割平面(HDU-2050)
  10. windows 开启mysql日志记录_Windows下MySQL开启历史记录
  11. 在JavaScript中创建命名空间的几种写法
  12. 全国政协常委胡晓炼:要重视数字货币与数字鸿沟问题
  13. JavaScript:利用StringBuffer类提升+=拼接字符串效率
  14. 从零开始学自然语言处理-十万字长文带你深入学习自然语言处理全流程
  15. 【上汽零束SOA】云管端一体化SOA软件平台系列介绍之四:车云一体架构篇
  16. matlab创建wps服务器,wps云文档服务器架设(mac版wps云文档在哪)
  17. dnf喇叭怎么设置不显示服务器,《DNF》屏蔽广告喇叭方法 广告喇叭怎么关掉
  18. 均值(average)与期望(mean)
  19. excel打开很慢_Excel打开很慢的解决方法
  20. 62道开发人员面试经典题

热门文章

  1. 19年8月 字母哥 第二章 RESTFul接口实现与测试 看到这里了
  2. 成人教育计算机统考分数查询江苏省,江苏省教育考试院查询
  3. fastdfs 集群 java_FastDFS集群部署(转载 写的比较好)
  4. jdk 流合并_JDK 12,合并的收集器和命名的挑战
  5. 乡村野生草药_官方野生蝇群流口水分数
  6. wildfly管理控制台_WildFly管理控制台已更新–请求反馈
  7. 创建一个Java :: Geci生成器
  8. 使用Spring Boot和Vue进行有益的开发
  9. 用Rocker制作模板
  10. 编译hotspot_从Hotspot JIT编译器打印生成的汇编代码