腾讯大数据旗下腾讯云分析(MTA)近日正式对外免费开放OCR文字识别服务。这项名为CRUX OCR的新业务将提供多个应用场景下的精准OCR模块,免费为相关需求的开发者提供便捷、稳定且安全的技术服务,当前识别速度快至0.1秒,准确率高达99.6%。

CRUX研发团队隶属于腾讯大数据,专注于计算机视觉、模式识别、机器学习等领域的技术研发和业务落地。CRUX的名字灵感来源于Computation、Recognition、Understanding和Exploration,寓意计算、识别、理解和探索,同时CRUX也是88个星座中的南十字星,与团队地处南国深圳相契合。团队核心成员主要来自于中科院、北大以及东京大学、香港城市大学等国内外知名高校,皆具有较深厚的学术研究背景以及扎实的工程能力。同时积极与国内高校进行密切的科研合作,不断提升自身的科研水平。CRUX OCR是团队经过一年多精心打磨而推出的字符识别全方位解决方案,目前已经支持通用文档识别、身份证识别、银行卡识别,后续将逐步拓展至更多相关领域的应用。

CRUX OCR应用

  1. 通用文档识别
    采用高效的图像预处理方法, 融入精准的文本行检测技术,有效提取文字特征,支持常见的文档图片, 可以应用于医疗病例识别、网络图片文字识别、金融票据等多种识别场景。

  2. 身份证识别
    快速准确定位身份证,识别出关键信息,可以广泛应用于金融、政务方面的身份证自动识别场景。

  3. 银行卡识别
    快速准确定位银行卡,以及卡号位置,精准识别卡片编码,可以广泛应用于互联网金融的银行卡号自动识别等场景。

CRUX OCR技术

CRUX OCR技术在传统的图像处理方法上融入精准文字检测技术,提取更鲁棒的字符特征用于识别,同时开发了中英文混合的语言模型用于OCR识别结果的后期校正。对一些较为特殊的应用场景如银行卡,在字符信息与背景难以区隔的情况下,创造性的提出一种类似树搜索方法来实现银行卡卡号的准确识别。目前我们也把深度学习融入到CURX OCR技术框架中,也在一些场景应用(如手写体识别,自然场景文字识别)里进行尝试并取得了较好的成果。

当前我们CRUX OCR技术主要部署在两端,一个是云端服务,一个是手机终端;云端能提供海量图片的OCR识别能力,手机终端能为用户群体提供个性化的定制应用,包括前端目标定位以及OCR离线识别等全流程实现;用户也可以基于我们的核心技术进行相应的后续技术开发和产品包装。

CRUX OCR技术具有识别高准确率,高稳定性,灵活,且便于二次开发等优点。

  1. 高准确率: 通过多种先进技术手段的应用,目前识别准确率处于业界先进水平, 基元字符识别准确率>99.6%, 银行卡单次识别准确率>85%, 身份证单次识别准确率>90%。
  2. 高稳定性:基于强大的后台开发能力,目前整个在线服务系统始终保持着极低的出错率。
  3. 灵活:我们为客户提供了全方位的技术支持,同时客户也可以根据自己的需求定制符合自己的OCR技术服务。
  4. 便于二次开发:在必须的时候,客户可以基于我们的技术通过二次开发来实现自己的需求和服务。

CRUX OCR案例

目前CRUX OCR技术已经在合作伙伴中得到了有效的应用,提供技术支持。

  1. 病例识别(互联网医疗,合作客户:杭州卓健科技公司):客户通过CRUX OCR技术对病历进行扫描,挖掘病历中的文本信息,生成电子病历,加强了医疗服务的网络化和信息化管理,同时提高了医疗服务质量。

  2. 新闻图片的文字识别 (合作客户: 腾讯OMG 新闻资讯部新闻产品中心) :通过OCR技术的引进,帮助实现对海量新闻图片数据的挖掘和甄别,加强内容管理能力,提高新闻质量。

  3. 趣图识别 (合作客户: 腾讯SNG 社交网络运营部数据中心商业智能组):利用OCR技术识别用户上传的GIF格式动图,对图中文字进行挖掘,帮助客户对海量用户进行分析挖掘,提高服务水平。
       

CRUX OCR未来

持续优化OCR技术,推动OCR技术的应用,是CRUX团队一直专注的两个方面。未来的几个主要方向包括:

  • CRUX不只专注于通用文档识别,会在自然场景,广告图片文字等方面来扩展OCR技术应用的维度;

  • CRUX不只专注于身份证、银行卡,后续会设涉及如:驾驶证、护照、户口本,港澳通行证等十多种国内外证件的识别;

  • CRUX会把OCR与更多的技术融合(视频分析、自然语言处理、自动翻译等)。

相信随着互联网发展,OCR应用将结合更多的领域,拥有更多创新的应用。

CRUX OCR:腾讯云分析永久开放免费OCR服务相关推荐

  1. 腾讯云分析MTA简略教程,以Android为例。

    1.简介(官网上拷贝的,可以略过哈): 腾讯云分析是一款专业的移动应用统计分析工具,支持主流智能手机平台.开发者可以方便地通过嵌入统计SDK,实现对移动应用的全 面监测,实时掌握产品表现,准确洞察用户 ...

  2. 【产业互联网周报】网易悄然上架网易会议App;阿里推出阿里云网盘App;腾讯云会展发布 “1+3易服务”体系...

    关注ITValue,看企业级最新鲜.最价值报道! [产业互联网周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的企业级服务.云计算.大数据领域的前沿趋势.重磅政策及行研报告.] 产业互联网 ...

  3. 搭建腾讯云通用文字识别General OCR项目及代码部署图文教程

    又双叒叕开始折腾新项目啦,今天研究什么呢?搭建一个图片文字识别,项目所需,都知道微信的扫一扫可以识别很多东西,之前搭建的扫码演示源代码直接拿过来使用识别,发现不行,,,只能扫码,其余的都不行,好吧,参 ...

  4. 重磅邀请函来了!首届“腾讯云+社区开发者大会”免费报名!

    2019独角兽企业重金招聘Python工程师标准>>> 欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由columneditor发表于云+社区专栏 2018年12月 ...

  5. 技术圈盛会!腾讯云+社区开发者大会免费报名!

    要问最近刷爆技术圈的大会是什么? 当然是腾讯云+社区开发者大会 腾讯云首届"腾讯云+社区开发者大会",将于2018年12月15日在北京隆重举行. 本次大会内容丰富,涵盖云计算,AI ...

  6. 腾讯云轻量应用服务器搭建后端服务-基于django,nginx,uwsgi,supervisor

    目录 1.防火墙设置 a. 腾讯云服务器网页端防火墙设置 b. ubuntu中使用ufw防火墙设置 2.新建django项目 3.uwsgi的安装与配置 a.安装uwsgi b.测试使用uwsgi加载 ...

  7. 腾讯云对象存储 python_腾讯云对象存储(COS)服务的 API

    注意: 此文档仅适用于 COS XML 版本,版本可登陆后在 COS 控制台首页查看. 此文档不适用于 POST object 的 HTTP 请求. 使用对象存储服务 COS 时,可通过 RESTfu ...

  8. 腾讯云开放DevOps敏捷开发套件,助开发者驶入开发快车道

    更多腾讯海量技术文章,尽在腾讯云技术社区:https://cloud.tencent.com/community 开发者如何在云计算时代更好的提升开发效率?8月23日,在腾讯"云+未来&qu ...

  9. 深度数据对比分析:阿里云服务器和腾讯云服务器那家好?

    服务器具有维护成本低,安全稳定,高可扩展性和 7 X 24 小时的售后支持的优势,因此云服务器成为中小企业建站的首要选择.国内的云服务器竞争也进入了跑马圈地的时代,以阿里云.腾讯云.百度云三大BAT为 ...

最新文章

  1. pandas使用groupby函数计算dataframe数据中每个分组的滚动统计值(rolling statistics)的语法:例如分组的N天滚动平均值、滚动中位数、滚动最大最小值、滚动加和等
  2. 计算机语言XML,在计算机中有一门语言叫“XML”,请问它的全称是什么?是什么含义?...
  3. linux下 USB动态监测 hotplug事件监测
  4. [转]谈谈团队的凝聚力
  5. 塞规公差带图_螺纹塞规公差及尺寸表
  6. 虚拟存储管理+地址变换+软考系统架构设计师
  7. 鸿蒙需要多少技能命中,【攻略团】鸿蒙困难(天音视角)
  8. 尘封多年的期权,价值千万...
  9. SqlCommand对象-ExecuteNonQuery()方法的使用
  10. linux 安装wkhtmltopdf 所出的问题
  11. springMVC源码分析--访问请求执行ServletInvocableHandlerMethod和InvocableHandlerMethod
  12. Kubernetes网络与CNI插件介绍
  13. Java整型byte、short、int、long的取值范围
  14. 分享一个简洁大气的门户网站模版
  15. 安装psacct或acct程序包
  16. 探究2020版《网上银行系统信息安全通用规范》的新变化
  17. allegro中BGA封装过孔扇出小技巧
  18. 一周学完MyBatis源码,万字总结
  19. 如何使用谷歌离线API发布谷歌卫星地图
  20. 内网渗透-windows远程用户管理

热门文章

  1. Java顺序栈的初始化_java - Java类变量初始化的顺序是什么? - 堆栈内存溢出
  2. 网易博客fengqing888搬家至CSDN啦
  3. python 命令行输入参数有误_python – 错误:参数太少,必须提供命令行包规范或–file...
  4. 如何在Samsung Galaxy设备上禁用快速充电(以及为什么要这样做)
  5. 微信小程序16进制颜色码
  6. JVE非我烟弹降价40%,电子烟价格革命真的来了
  7. 彻底搞懂equals以及hashCode方法(源码级分析)
  8. animate.css源码
  9. 对v-for生成的元素添加不同的animate动画
  10. Redis进阶-发布订阅简介