PDF文件的身份证号码

1 身份证
我们每个成年人都有一个身份证, 身份证上有很多信息, 有我们的姓名, 性别, 籍贯, 出生日期, 还有一个很重要的就是身份证号码. 而且每个人的身份证号码都不相同。我们的这些身份证上的信息包括省份证都进入了信息库。
而我们也经常在某些场合填写自己的身份证号码,比如开办银行帐号的时候。而一旦有了该号码,银行就可以获取你的其它基本信息,因为你的身份证号码是唯一的,而在身份证上的其它信息都不是唯一的,同名的人很多,同出生日期的人更多。
类似的还有超市里的货物标签,每个标签只有一个条形码和对应的号码,不过这个条形码有很多的对应信息,因此说经过读码器扫描后可以得到相应的货物名称,出厂日期,价格等等信息。对于货物来说条形码就是其身份证号码,方便和加速了货物的销售及管理。
2 PDF文件的身份证号码
每个PDF文件都有个唯一的字符串与该文件对应,我们可以把它看作是该PDF文件的身份证号码,其字符串保存在文件的trailer字典中。用文本编辑器打开一个PDF文件,可以看到:
<</Size433/Root 1 0 R/Info 3 0 R/ID[<2C12621CBD44224CA14C29823A6B31F4><2C12621CBD44224CA14C29823A6B31F4>]>>
其中红色部分就是文件的ID。ID是一个数组,有两个元素,都是32字节长度, 而且这两个元素的内容完全一样。第一个元素是不变的,而第二个元素是会随着PDF文件的修订而改变的。我对该文件在ACROBAT里做了修改,trailer字典变成如下:
<</Size433/Root 1 0 R/Info 3 0 R/ID[<2C12621CBD44224CA14C29823A6B31F4><BC67F3302346184DA5CCE275D6BD836D>]>>
我们会发现ID数组的第二个元素发生了变化,说明该PDF文件在创建以后已经被修改过了。
3 如何获得PDF文件的身份证号码
那这个ID是如何生成的呢?PDF规范没有作限定,如果你要生成一个PDF文件,那么你可以定义自己的方法来生成该ID,当然要确保该ID的唯一性。
因此一般该ID是通过文件的内容,文件的生成或修改日期,甚至计算机的硬件信息等来产生的HASH序列。
4 PDF文件身份证号码的作用
PDF中的ID对一些文档的处理流程格外有用,如果我们要管理大量的文件,我们必须建立一个文件信息表,对于每个文件都需要设置一个唯一的ID,这个ID一般是流水号。这种方式系统的耦合性非常大而且很容易造成文件的重复和空间的浪费。
举个例子,我们有两个这样的系统,每个系统都独立地维护一个数据库,有可能我们会在这两个系统中录入一些相同的文件,但是他们的ID号不同,因此说如果要将这两个数据库合并(也不可能合并),那么势必会造成资源的极大浪费。
一般来我们的文档系统都有服务端和客户浏览器。如果利用PDF文件自身携带的ID来作为唯一的标识,那么就不必要再传送额外的信息了,PDF浏览器可以通过该PDF文件中的ID来和服务器端进行一些交互和接受服务器端的管理,极大地方便了文档的处理流程。

PDF文件的身份证号码相关推荐

  1. Django项目实战: Django + PyPDF2实现PDF页面提取和PDF文件输出

    在日常工作中我们经常需要从一个大的PDF文档中提取我们所需要的页面,所以今天我们将教你用Django + PyPDF2开发个小Web应用: 用户上传一个PDF文档,输入需要提取的页面号码,点击确定后浏 ...

  2. Java生成PDF文件保存到本地磁盘

    使用IText进行创建 代码 package cn.xx.xx.util;import com.itextpdf.text.*; import com.itextpdf.text.pdf.BaseFo ...

  3. docx4j实现word文件转换pdf文件

    目录 前言 PDF文件导出 word文件转换pdf文件 前言 前段时间在项目中遇到了导出pdf的问题,之前在项目中遇到导出文件莫不是excle或者word文件的导出,所以在遇到需要导出pdf文件时,我 ...

  4. iOS身份证号码识别

    最近不少简友说git上下载下来的代码报各种问题,因为包含的库都比较大,所以大家在pod的时候耐心等待,另外我已经将代码适配到了iOS10. 一.前言   身份证识别,又称OCR技术.OCR技术是光学字 ...

  5. 智能实验室-身份证号码查询(IDio) 1.4.0.140

    身份证号码查询(IDio)是用以根据身份证号码查找所属的省市区.出生年月日.性别等信息的工具. 特点: 1.准确及时:包括最新的行政区域信息: 2.地图定位:一键显示地区地图信息: 3.完全免费:我们 ...

  6. python验证身份证号码大全_身份证号码处理技巧大全

    身份证号码处理技巧大全,汇总了常用的身份证号码处理六大技巧: 不需要复杂的公式,点点鼠标即可完成,简单快捷,下面将详细介绍六大功能的具体用法.(文章最后有工具和演示文件的下载地址,可以下载下来同步操作 ...

  7. java 身份证地址提取籍贯_从身份证号码中提取信息,这些方法请收好

    小伙伴们好啊,今天老祝为大家准备了一组和身份证有关的函数公式,看看如何从身份证号码中提取出需要的信息. 如下图为所示,是一份模拟的员工信息表,A列是姓名,B列是身份证号码,C列是职级. ★ 首先咱们来 ...

  8. 处理导出到EXCEL时,身份证号码的问题:mso-number-format

    应用中经常会遇到要从系统或数据库中导出数据平面文件,一般是导出到txt,csv或excel.txt和csv一般用在系统间的数据交换,而 excel一般有较好的显示效果,可以按照一定的模板导出,导出就不 ...

  9. PDF文件简介及PDF文档加密方法

    PDF文件的认识: Adobe Reader 关于PDF的图标PDF全称Portable Document Format,译为可移植文档格式,是一种电子文件格式.这种文件格式与操作系统平台无关,也就是 ...

最新文章

  1. Python中的输入输出
  2. ubuntu apt-get彻底卸载软件包
  3. 第十五周项目1-打入“内部”寻“内幕”
  4. 《剑指offer》-- 数组中的逆序对、最小的K个数、从1到n整数中1出现的次数、正则表达式匹配、数值的整数次方
  5. uniapp小程序迁移到TS
  6. 中望cad能编写lisp吗_宁水集团:中望CAD解决方案增强设计创新力,加速转型促发展...
  7. VMware终端用户计算的战略和愿景
  8. 剑指offer 33 把数组排成最小的数
  9. java命令_java常用命令javac、javap、jps、jstack
  10. 神经网络 demo(斯坦福)
  11. 存储卡修复软件测试自学,扩容内存卡用mydisktest失效,教你怎么用USBoot恢复出真实容量...
  12. linux微信登陆失败,微信登陆失败原因与解决方法
  13. 计算机专业个人简历表格模板
  14. 一起捉妖服务器还要维护多久,一起来捉妖:在线6小时被劝退?只需网络断开,跳过等待15分钟...
  15. python数据分析基础试题及答案_Python数据分析与数据可视化题库免费期末考试2020答案...
  16. Buct oj 1016
  17. JAVA打印指定长度的随机英文字母(小写)
  18. 在地址栏上输入一个url,到这个页面呈现出来,中间会发生什么?
  19. confluence的一些环境变量说明
  20. 南京网预赛02 BY bly

热门文章

  1. 大数据与Hadoop之间是什么关系
  2. ClassNotFoundException: org.codehaus.plexus.logging.LoggerManager
  3. 大炮打蚊子 (15 分)(二维数组训练)
  4. 移动安全事件总结情况说明
  5. 【渝粤教育】国家开放大学2018年春季 0284-22T外国文学 参考试题
  6. 警用宽窄带融合技术国际学术交流会成功召开
  7. RL(十三)深度Q网络(DQN)
  8. 当今软件发展的现状非常适合 Cloud Native 环境 1
  9. 敏捷遇上UML(深圳 2014.3.15)- 活动报道
  10. (转)chrome浏览器收藏夹(书签)的导出与导入