档案数字化中的OCR应用
信息时代,档案数字化已成为档案工作的重中之重,纸质档案扫描工作在各地如火如荼地进行。然而,扫描所产生的电子档案实际上只是以图像形式存在的文件,而非真正意义上的文本文件。也就是说,计算机只认识档案的外表,却不认识其内在文字。用户通过计算机只能看到档案的原貌,却不能对其中的内容进行引用、检索等操作,这无疑对将来的电子档案利用工作造成了很大的不便。考虑到档案用户的利用需求,若要得到真正文本形态的电子档案,使档案数字化工作更加有效、更加彻底,便要应用到OCR技术。OCR技术的优势及其在档案数字化过程中的应用OCR技术相对于传统的手工录入方式来说,具有强大的优势。首先,OCR文字识别的速度远快于手工录入。根据国际通行的打字速度评级标准,即使是专业人员,每分钟也仅能输入150~240个字。而采用OCR技术,即使算上前后期的处理环节所花时间,其速度也绝对比前者快好多倍。其次,OCR文字识别的质量远高于手工录入。虽然由于各种因素影响,OCR技术的识别率很难达到100%,但比起大批量手工录入,其出错率要小得多。最后,OCR还节省了大量人力资源,优化了资源配置,使人员分配于更加有意义的工作。对于档案数字化工作来说,云脉OCR技术除了具有以上几个普遍的优势之外,还有以下独特核心功能:AI文字识别技术及栏目识别技术:识别率领先、速度快。AI智慧检索:任意关键字全文模糊检索、匹配结果图像高亮标识。搜索精度高、秒出。AI图像处理技术:自动切边、倾斜校正、图像增强美化、压缩、导出。AI智慧纠错:自动标注可能错字,相似字及前后联想字用以快速纠错。云脉技术将纸质档案数字化并采用OCR识别,能够使档案信息资源实现全文检索、网络传输、方便用户异地检索、复制引用。从而深化用户对档案内容的查询与利用,拓宽其利用面。使档案也能像图书、情报一样成为人们日常生活中获取信息、利用信息、增加学识的手段使档案多方面地服务于公众。
档案数字化中的OCR应用相关推荐
- 档案数字化中OCR的运用
档案数字化中OCR的运用 信息时代,档案数字化已成为今后一段时期档案工作的重中之重,纸质档案扫描工作在各地如火如荼地进行.然而,扫描所产生的电子档案实际上 ...
- 数码数字字体_档案数字化技术规范
1 适用范围 为统一公司纸质.照片.音频.视频档案数字化的主要技术要求,推动档案现代化和数字档案馆的建设,特制定本规范. 本规范适用于各单位档案的数字化处理及数字化成果的管理. 2 总则 2.1 基本 ...
- 泛微实物档案数字化管理方案,全面优化组织档案管理
组织业务和规模的发展过程中会产生大量的实物档案资料,管理过程随时都有可能出现"用的时候找不到.用完不还.机密文件丢失"等现象,管理起来工作量不小. 近日,国家档案局发布的<实 ...
- 档案系统专用服务器属于什么设备,想做档案数字化,却不了解所需设备?3分钟让你不懂到精通!...
原标题:想做档案数字化,却不了解所需设备?3分钟让你不懂到精通! 本期主编:橙子 近几期有好多粉丝留言表示对档案数字化很感兴趣,想了解一下档案数字化加工设备,这一期给大家出一篇干货科普,对数字化设备感 ...
- 计算机在档案管理中的应用,浅谈计算机在档案管理中的应用
随着计算机技术信息技术迅猛发展和广泛应用,计算机技术为档案信息资源的科学管理和有效开发利用创造了前所未有的契机,信息成为知识经济时代最为重要的资源.目前,档案电子化是档案管理工作必须实施的重要工作,已 ...
- 区块链技术在电子档案管理中的应用场景分析
在上一篇文章<区块链基本特性及其与电子档案管理的契合点>中已经提到,基于区块链技术"去中心化.不可篡改.公开透明.可追溯"等基本特性,有望解决电子档案管理中可信管理.资 ...
- 档案管理在计算机中的应用,计算机信息技术在档案管理中的应用论文原稿
<计算机信息技术在档案管理中的应用论文原稿.doc>由会员分享,可免费在线阅读全文,更多与<计算机信息技术在档案管理中的应用论文原稿>相关文档资源请在帮帮文库(www.woc8 ...
- 什么是数字档案室?纸质档案数字化和数字档案室的区别与联系
数字档案室建设的首要任务,就是要把传统载体的档案数字化,而绝大多数传统载体档案均为纸质档案,也就是说,纸质档案数字化是数字档案室的首要任务.2013年10月 时任国家档案局局长杨冬权在全国数字档案馆( ...
- 档案数字化是档案管理的未来趋势
随着大数据.云计算.区块链.人工智能等数字化技术兴起,让我们意识到"大数据时代"已经到来了.更多的新型技术已经融入到我们的生活,数字化发展的趋势已经遏制不住了,未来也会向数字化发展 ...
最新文章
- 开发常见错误解决(1)注册.NET EnterpriseServices COM+组件,事务服务不可用
- 16*64点阵屏的c语言程序,16*64点阵程序 - 单片机/MCU论坛 - 电子技术论坛 - 广受欢迎的专业电子论坛!...
- Ubuntu 删除dash 中无效的图标
- tf2.1下生成yolo.h5文件
- 深度学习入门——波士顿房价预测
- [译] 或许你并不需要 Rust 和 WASM 来提升 JS 的执行效率 — 第二部分
- 12.Kong入门与实战 基于Nginx和OpenResty的云原生微服务网关 --- 高级案例实战
- 灵悟礼品网上专卖店——分析类似项目的优缺点
- easyar android 开发,【EasyAR学习】安装Android SDK
- python逐行读取xls文件
- iOS开发UI篇—iPad和iPhone开发的比较
- 科普一下网络的灵魂 ACL
- MySQL用户权限系统
- jQuery 官网下载js
- jupyter notebook 实用快捷键大全
- Photoshop 2023 Mac(PS 2023)v24.0.0中英文已发布,新功能详细介绍,支持M1/M2/intel
- Java 创建并用应用幻灯片母版
- 浅谈触摸屏技术以及未来的发展趋势
- “泰迪杯” 挑战赛 - 基于市场资金流向分析的商品期货量化交易策略(附suibian代码)
- 最新消息!2022年全国大学生数学建模竞赛评阅要点发布