数字经济快速发展的背后,全球数据总量呈现出爆发式增长趋势。智能文档处理(IDP)技术能够高效地从多格式文档中捕捉、提取和处理数据,帮助机构和企业大幅提升文档处理效率,节约时间和人力成本。近期,合合信息智能文字识别产品通过中国信息通信研究院(以下简称“中国信通院”)“可信AI—智能文档处理系统”评估工作,并获得“5级”评定。据悉,“5级”为该模块最高评定等级。

人工智能技术的应用场景正在不断拓展,其发展也面临着产品能力参差不齐、缺乏行业基准和标杆、安全可信要求落实不明确等问题。中国信通院于2018年起逐步构建和完善“可信AI”评测体系,助力人工智能技术的发展和产业的健康成长,“智能文档处理”是近两年来新增的评测项目之一。

中国信通院智能文档处理系统评测体系介绍(图源:中国信通院)

国际数据公司(IDC)最新发布的预测数据显示,中国数据量规模将从2022年的23.88ZB增长至2027年的76.6ZB,年均增长速度(CAGR)达到26.3%。其中,企业数据量占据70%,目前仅有24%的数据被用于分析或AI决策。由此可见,企业在经营中沉淀下来的数据,有大部分价值尚待释放。

计算机信息化系统中的数据分为结构化数据和非结构化数据,人们日常生活、工作中所接触到的各类办公文档、文本、图片、报表都属于非结构化数据。由于格式复杂、标准多样,非结构化数据处理起来既困难又耗时,智能文档处理技术可以把关键信息从半结构化/非结构化数据中提取出来,进一步实现业务流程的端到端自动化。IDC认为,智能文档处理技术是提升部分行业、业务、流程的核心生产要素,随着与应用和流程自动化的深度整合,潜在的应用场景广泛,普及空间较大。

目前,智能文档处理技术已被广泛应用于文档数字化管理、自动化流程、图文提取等业务场景,并加速渗透金融、政务、医疗、海关等垂直领域。中国信通院持续关注智能文档处理技术及应用的发展情况,依据《自然语言处理技术和产品评估方法 第8部分:智能文档处理系统》,全方位评估企业智能文档处理的技术先进度。

评估结果显示,合合信息智能文档处理产品在通用能力及AI核心能力方面均表现优异:

通用能力方面,合合信息产品在信息抽取、表格文字识别、版面分析等方面均获得5分评分。表格文字识别、版面分析是文档处理的难点,合合信息表格文字识别技术支持识别图片/PDF格式文档中的多类型表格内容。在财报相关表格识别测试中,合合信息有线表识别单元格结构准确率高于98%;无线表识别在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。

合合信息“表格文字识别”处理效果展示

合合信息版面分析技术通过解决版面分割、区域间的逻辑关系处理等方面的难题,可将文档图像切分成不同类型内容(文本、图形、公式、表格等)的区域,并分析区域之间的关系,让机器更精准地确定文档中的文字位置、字体、大小和排版方式,从各类版式复杂的图片文档中精准获取信息。

AI核心能力方面,合合信息产品在NLP领域的文本分类、知识图谱领域的实体识别、关系抽取及OCR领域的字符识别、文本行识别均获得5分评分,并支持文本生成、事件抽取等高阶处理能力,其中准确率、召回率、F1值等指标评分总体较高。

合合信息创立于2006年,是一家人工智能及大数据科技企业。合合信息智能文档处理产品是一款集图像处理、文档质量判断、文档识别、版面分析、文档结构化信息抽取、存储、检索、管理等技术于一体的智能文档解决方案产品,旨在帮助个人和企业实现文档信息化管理。

技术发展之路上,安全是不可缺席的话题。本月,中国信通院携手合合信息启动了《文档图像篡改检测标准》制定工作,中国图象图形学学会、中国科学技术大学等知名学术机构参与联合编制。该检测标准将基于产业现状,围绕“细粒度”视觉差异伪造图像鉴别、生成式图像判别等行业焦点议题,凝聚行业共识,为中国“可信AI”在机器视觉、图像处理领域的体系建设提供有力支持。

通用能力及AI核心能力表现优异!合合信息智能文档处理系统(IDP)高评级通过中国信通院评估相关推荐

  1. 网易云信参编中国信通院《智能双录系统基础能力要求》标准正式发布

    近年来,用户通过远程办理金融业务的需求开始逐渐凸显,双录正在从传统的线下模式向更加智能的线上模式转变,以保障用户在线上办理金融业务全过程的合规性,提升用户体验. 为了更好地规范智能双录技术服务.推动应 ...

  2. 字节跳动联邦学习平台通过中国信通院首批评估 数据安全能力得到专业验证

    近日,中国信息通信研究院(以下简称"中国信通院")公布了安全评估结果,字节跳动Fedlearner联邦学习平台(以下简称"字节跳动Fedlearner")成为顺 ...

  3. 首批!腾讯云通过中国信通院政务协同平台解决方案能力评估

    6月13日,中国信通院公布了"政务协同平台解决方案"评估成果,腾讯云成为首批通过评估服务商. "十四五"时期,随着5G.区块链等新技术加速发展,社会和商业的运转 ...

  4. 第五款!美创数据水印溯源系统通过中国信通院数据安全能力评测

    近期,中国信息通信研究院安全研究所发布"数据安全产品能力验证计划"第六期通过企业名单.美创科技数据水印溯源系统顺利通过测试,成为美创第五款通过权威检验测评的数据安全产品! 此前,中 ...

  5. 华为云ModelArts获得中国信通院首批AI开发平台全能力域领先级证书

    近日,由中国人工智能产业发展联盟(AIIA)指导.中国信息通信研究院云计算与大数据研究所主办的2021可信AI成果发布会在线上举行.会上,主办方公布了人工智能开发平台功能评测结果,在产品能力赛道,华为 ...

  6. 华为AppCube通过中国信通院“低代码开发平台通用能力要求”评估

    摘要:华为AppCube应用魔方顺利通过信通院评估,被认证为具备 "低代码开发平台通用能力"的企业服务平台. 本文分享自华为云社区<华为AppCube通过中国信通院" ...

  7. 中国信通院开展网络安全调研;首尔大学AI团队被发现抄袭;微信公众号禁止从事虚拟货币等行为 | 每日大事件...

    数据智能产业创新服务媒体 --聚焦数智 · 改变商业 01.中国信通院开展网络安全产业调研 6月27日,据中国信通院消息,为充分认识我国网络安全产业运行发展态势,准确把握企业主体的经营战略.创新布局和 ...

  8. 合合信息亮相CCIG2023:多位大咖共话智能文档未来,文档图像内容安全还面临哪些技术难题?

    近日,中国图象图形大会(CCIG 2023)(简称"大会")在苏州圆满落幕.本届大会以"图象图形·向未来"为主题,由中国科学技术协会指导,中国图象图形学学会主办 ...

  9. 中国信通院栗蔚解读“云计算发展现状与可信云评估” 肯定“信创云基座”的可信能力

    2021年6月10日,信创云计算专家华云数据在京举办信创云基座产品发布会暨生态伙伴大会,发布了"信创云基座"产品.会上,中国信息通信研究院云计算与大数据研究所副所长栗蔚分享了云计算 ...

最新文章

  1. 使用Gearman做分布式计算
  2. 2009年2月Windows Mobile Webcast预告
  3. 你必须知道的ADO.NET(一) 初识ADO.NET
  4. 饿了么交易系统应用架构演进
  5. JQuery Mobile 手机显示页面偏小
  6. 软件测试性能测试结果,软件性能测试结果分析工具的研究与设计
  7. 【渝粤题库】陕西师范大学292241金融市场学Ⅰ 作业(高起专)
  8. dao-service-servlet-jsp构建简易web通讯录(三层开发)bug1
  9. NodeMCU(ESP8266)获取NTP时间
  10. 常用shell命令归纳总结
  11. DeepL与有道翻译对比
  12. Matlab---示波器Scope-Measurements
  13. IDE、SATA、SCSI、SAS、FC、SSD硬盘类型介绍
  14. 广州移动MGV3001_ZG_S905L3_UWE5621DS_线刷固件包
  15. uni-app 快手小程序如何设置跟元素样式
  16. 咏南中间件2019新年促销
  17. 如何对APP进行重新签名(使用命令签名)
  18. 整理的遥感期刊,SCI检索,3/4区居多
  19. CentOS 7安装chrome
  20. 阿里云邮箱短信验证和阿里云手机短信发送

热门文章

  1. 关于 管理工具---服务。
  2. sql server 2012 如何收缩事务日志(脚本)
  3. ZEMAX卡塞格林透镜组结构设计——光学设计学习笔记2
  4. SQL SUM() 函数
  5. 看《网络安全漏洞的罪与罚》有感
  6. Janus源码分析(5)——echotest分析
  7. 校园O2O商铺平台-扩展
  8. 从G_BEGIN_DECLS和 G_END_DECLS说起
  9. EasyCVR调用云端录像接口报错“Channel[5] Not Enabled“处理
  10. 三国志幻想大陆优秀的美术和动作背后有什么原因?艺点动画带你来解答