文本识别技术(OCR)可以识别收据、名片、文档照片等含文字的图片,将其中的文本信息提取出来,代替了人工信息录入与检测等操作,降低了输入成本,快速、方便,提升产品的易用性。

随着技术的发展,OCR已经深入生活的诸多方面。交通场景下,主要用于车牌识别,便于停车场管理、智能交通、移动警务等;生活场景下,主要用于证照识别,便于提取身份证、银行卡、护照、结婚证、户口本、营业执照等证照图像的文字信息,还可对街景路牌进行识别;票据场景下,主要用于发票凭证识别,便于银行、税务等大量票据表格录入及长期存储;其他场景下,可以利用OCR对书籍、报告、简历、合同等文件进行识别,将纸质文件电子化,便于保存和查看。

Demo

HMS Core机器学习服务OCR能力在2020年01月15日首次上线,为开发者们提供了丰富的API接口,HMS Core OCR能力支持任意角度的文本识别,对横竖排、弯曲文本精准识别的同时,还能对文本段落进行准确划分,对文本内容精确定位。为了保证一些卡证、票据的隐私性,HMS Core OCR能力还支持端侧和云侧推理,端侧适合相机或视频画面实时处理,图片中稀疏文本识别,当调用端侧接口时,可识别中文(简体)、日文、韩文、拉丁语(包括英文、西班牙文、葡萄牙文、意大利文、德文、法文、俄文)10个语种;云侧对文字识别精度要求高,适合图片中稀疏文本识别、文档图片密集文本识别,当调用云侧接口时,可以识别中文(简体)、英文、西班牙文、葡萄牙文、意大利文、德文、法文、俄文、日文、韩文、波兰文、芬兰文、挪威文、瑞典文、丹麦文、土耳其文、泰文、阿拉伯文、印地文19个语种,核心语种的识别精度达到行业顶尖水平。

基于用户需求和技术进步,HMS Core 机器学习服务OCR能力进行了升级优化:端侧模型轻量化、准确率提升。

能力演进:

1、端侧模型轻量化:文本识别端侧10个语种能力增强(模型层面)

KPI不变,端侧模型轻量化压缩42%,运行所占内存从之前版本的19.4M降到11.1M左右。

模型的轻量化将模型体积缩小,并且可以轻量化展示,内存占比小,运行更加流畅。

2、准确率提升:云侧OCR能力演进(中文模型)

云侧OCR中文识别准确率从87.62%提升到92.95%,高于行业平均水准,竞争力大幅提高。

技术描述:

OCR是通过检测纸上的字符,以检测暗、亮的方式确定其形状,而后用字符识别法将形状翻译成计算机文字的过程。即针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并经过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

由于通用领域中存在大量弯曲文本的情况,算法团队通过重新设计文本检测模型,在横向文本的基础上,增加了任意旋转角度、弯曲文本的支持,使得在出行、广告牌等场景下的准确率和易用性大大增加。

文本识别还支持纯端侧推理,在涉及各类卡证、票据等隐私信息的场景下,相比云侧服务更加安全、可靠。考虑到端侧设备的算力、功耗等因素,算法团队通过巧妙的模型框架设计、量化、剪枝等技术,在保证识别精度的情况下,将识别模型压缩到商用的标准,保证用户的使用体验。

竞品对比:

OCR能力演进后,端侧和云侧的识别准确率都在业界属于领先地位。

云侧平均准确率高于竞品约7%,时延仅为竞品的55%。

端侧平均准确率和模型体积均优于竞品,一些小语种的准确率甚至达到95%。

优化更新:

  1. 基于现在市面上OCR能力大多只针对印刷体字符, HMS Core机器学习服务正在进行通用手写体识别能力的开发(手写体识别、手写体+印刷体混合识别)。
  1. 加入更多语种,预计新增罗马尼亚语、马来语、菲律宾语等。
  1. 预计新增版面分析功能(PDF重排),机器学习服务支持多种内容识别处理功能,提升自身AI能力竞争力。

为了满足众多场景需要,HMS Core会不断开发新功能帮助开发者构建多元化应用,后续新增功能以华为HMS Core机器学习服务联盟官网为准。

了解更多详情>>

访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee

关注我们,第一时间了解 HMS Core 最新技术资讯~

机器学习服务文本识别能力演进,大幅提升识别准确率相关推荐

  1. 百度语音识别技术负责人李先刚:如何利用Deep CNN大幅提升识别准确率?

     百度语音识别技术负责人李先刚:如何利用Deep CNN大幅提升识别准确率? 机器之心mp 2016-11-04 14:24:34 技术 百度 阅读(440) 评论(0) 机器之心原创 作者:赵云 ...

  2. 机器学习服务文本翻译能力升级,中文直译模型让译文表达更地道!

    HMS Core机器学习服务文本翻译能力提供多种语言和多种应用场景的翻译服务,比如,在出国旅游的场景中,用户可以借助应用的语音翻译播报功能在打车.酒店入住等场景中无障碍沟通,也可以通过拍照翻译功能读懂 ...

  3. 超简单集成华为HMS Core MLKit 机器学习服务银行卡识别SDK,一键实现银行卡绑定

    前言 小编前面几期文章分别给大家介绍了使用HMS ML Kit SDK实现微笑抓拍.证件照DIY.拍照翻译的功能开发(链接见文章末尾),本次小编给大家带来的是使用HMS 机器学习服务(ML Kit)银 ...

  4. 文本分析软件_十大针对机器学习的文本注释工具与服务,你选哪个?

    房地产和键 [51CTO.com快译]目前,从搜索引擎与情感分析,到虚拟助手与聊天机器人,机器学习应用场景中的许多研究领域,都需要通过文本注释工具与服务来提供准确性.在AI研究与开发行业中,发现或创建 ...

  5. HMS Core 机器学习服务6.4.0版本更新啦,文本翻译功能增加10种小语种语言类型

    近日,HMS Core机器学习服务(ML Kit)文本翻译功能在6.4.0版本更新中增加了10种小语种语言类型,分别是马其他语.马其顿.冰岛.乌尔都语.波斯尼亚语.乌克兰语.加泰罗尼亚语.斯洛文尼亚语 ...

  6. python 文字识别 准确率_关于OCR图片文本检测、推荐一个 基于深度学习的Python 库!...

    大家好,我是 zeroing~ 1,前言 之前谈到图片文本 OCR 识别时,写过一篇文章介绍了一个 Python 包 pytesseract ,具体内容可参考 介绍一个Python 包 ,几行代码可实 ...

  7. 机器学习服务助应用内文本语种在线和离线检测

    当用户有跨语种交流或内容翻译的需求时,应用需要能自动检测文本的语种再进行翻译. HMS Core机器学习服务的语种检测服务提供在线语种检测和离线语种检测,既支持检测单语种文本,也支持检测混合语种文本, ...

  8. 华为机器学习服务语音识别功能,让应用绘“声”绘色

    随着人们对生活的仪式感的追求,移动设备.可穿戴设备.智能家居设备.车载信息娱乐系统也变得越来越流行.在这些应用上,鼠标.键盘这样的交互方式不再便捷,而语音作为人类之间最自然的交流方式,语音识别技术俨然 ...

  9. PAI分布式机器学习平台编程模型演进之路

    摘要: 在云栖计算之旅第5期-大数据与人工智能大会上,来自阿里云大数据事业部的九丰分享了<PAI分布式机器学习平台编程模型演进之路>.他主要介绍了在集团中使用机器学习解决大数据问题时如何通 ...

最新文章

  1. Fortify 17.10进行源代码安全扫描的方法
  2. 异构平台同步(mysql--oracle)
  3. python中栈_Python中的栈
  4. 使用 Navicat Lite 连接 Oracle 数据库
  5. 360手机浏览器_360手机浏览器9.0新功能测评
  6. kickstart research
  7. SQL必知必会-数据插入
  8. MATLAB学习笔记(十八)
  9. c++中stack用法( 算法竞赛入门)
  10. 如何用R来定制个性化PPT
  11. 为什么不能在scrollview中直接添加一个image,然后使animation.begin()??
  12. HelpDesk工作流多级,多任务流程(包含源代码和InfoPath模板)
  13. 地理必修一三大类岩石_90后地理老师4天收700封情书!这波操作,绝了……
  14. 微软高级流格式ASF简介
  15. 先少谈点人工智能好吗?
  16. 六成受访美国人认为教育系统正在令这一代人失望
  17. Flash cs6 如何从FLA 文件导出sound文件
  18. 世界各国 省市县 省份 城市 三级数据库表 mysql
  19. Flink DataSet API
  20. 自己动手画CPU之汉字字库存储芯片扩展实验

热门文章

  1. hdu3911 Black And White (线段树/区间合并)
  2. COCOS-BCX|区块链项目介绍
  3. Java录制网页_Java 录制语音的实现代码
  4. RequireJS - 用法
  5. java resultful风格接收参数
  6. msi(微星)UEFI模式 机械加固态双硬盘安装Ubuntu16
  7. 计算机科学丛书之第9章和第10章代码
  8. 包中校中辉盛业集团荣获“中国优秀诚信品牌”奖项
  9. 8通道250MSPS 14位AD采集FMC子卡
  10. Android 中怎么重启APP、重启系统