欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~

OCR 是人工智能里面非常重要的基础能力之一。腾讯云人工智能产品总监王磊,结合物流场景解读了OCR技术。“OCR文本识别能够优化物流行业流程,解放人力降低成本。”

腾讯云人工智能产品总监王磊

王磊介绍,OCR文本识别存在三大挑战。其一是文本是由多个文字拼接组成,没有明显边界,文本框内除了笔画,其余部分均是背景,给文本识别特征提取带来难度;其二是文本是由若干汉字、英文或标点符号混合在一起,长度变化大,由于网络感知野受限,定位BOXES本身困难;其三是如果BOXES贴合精度不够,会直接导致后续的文字识别错误。腾讯优图实验室为OCR识别搭建了四层处理系统,并配备三大引擎。一是运单的版式识别引擎,可以对运单的版式进行分类;二是运单的字段定位引擎;三是运单的字段识别引擎。

为了解决这些问题,腾讯优图实验室在文本检测技术方进行了深度优化,提出了Compact Inception,通过设计合理的网络结构来提升各尺度的文字检测/提取能力。同时引入RNN多层自适应网络和Refinement结构来提升检测完整性和准确性。

在文本识别方面,经过大量实验和实践,腾讯优图实验室对主流CNN+RNN+CTC方法进行了改进和创新:对CNN加入了横向非对称卷积和综合多种尺度感受野的特征,增强了网络对多尺度字体的支持。对RNN加入了Attention机制。Attention机制的加入,可以在所有特征块的基础上,得到每一个特征块在全局中的权重信息。简单的理解,当决定当前字是几个形似字中的哪一个时,该字所处的上下文位置和语义相关性是更具有决定意义的,甚至会比图像信息本身更重要。可以有效提升整行识别的准确率。性能上则通过网络轻量化设计和裁剪、矩阵计算优化、通道优化、GPU/CPU的定向优化等技术,保证了实际应用落地。现在腾讯云OCR能够做到7×24小时提供识别服务,每张运单5秒钟可以完成;识别准确率达到91%,并且整个识别流程不需要人工深度参与,极大的降低用户隐私泄露的风险。

相关推荐 腾讯云王琰:腾讯云AI Cloud的技术、应用布局和趋势 识别手写快递单、听懂人话的小微...腾讯云公布了哪些大动作?

欢迎关注腾讯云技术社区,更多技术干货等着你。

此文已由作者授权腾讯云技术社区发布,转载请注明文章出处: cloud.tencent.com/community/a… 传播腾讯海量技术实践经验,www.qcloud.com

王磊:AI 时代物流行业的 OCR 应用相关推荐

  1. 揭秘5G+AI时代的机器人世界!【附报告下载】

    AI 和 5G 与机器人技术结合,正在不断催生新的消费电子品类.AI 解决机器理解世界,以及人机交互的问题.5G 拓展机器人的活动边界,并为机器人提供更大的算力和存储空间(云协作机器人) . 今天,我 ...

  2. 2022-2027年中国互联网物流行业发展前景及投资战略咨询报告

    [报告格式]电子版.纸介版 [出品单位]华经产业研究院 本报告由华经产业研究院出品,对中国互联网物流行业的发展现状.竞争格局及市场供需形势进行了具体分析,并从行业的政策环境.经济环境.社会环境及技术环 ...

  3. 刘铁岩:AI打通关键环节,加快物流行业数字化转型

    导语:近日,在微软亚洲研究院创新论坛上,微软亚洲研究院副院长刘铁岩分享了关于"AI+物流"行业的实践经验.以下为其发言内容. 随着时代的发展,人工智能成为了决定性的技术,我们所谈的 ...

  4. 将物流行业送往智能时代,菜鸟网络的配送车已经上路了

    过去十年,电子商务行业的高速发展有目共睹,网购已经成了年轻人日常生活中不可或缺的一部分,甚至衍生出了"6·18"."双11"这样的购物狂欢节,而且这股浪潮正逐渐 ...

  5. “AI+物流”:百度大脑助力物流行业智能化升级

    随着互联网与电商的蓬勃发展,快递已成为大众生活中不可或缺的部分--在中国,每天都有上亿件包裹被运输,在『双十一』.『618』等电商狂欢节,快递运输量更是呈指数级增长.然而,作为劳动密集型产业,固有模式 ...

  6. NIUDAY 11.23 北京站抢票啦 | 看 AI 落地行业 享 AI 时代红利

    2018 年是见证「奇迹」的一年.AI 从多年的热门话题中开始走下神坛,逐渐深入到了各个行业,加速经济结构优化及行业智慧化升级,AI 已不再是难以企及的神话而是可触摸的美好未来. 政策支持加上资本推动 ...

  7. 新零售时代下,物流行业迎来新机遇

    电商,一个异军突起的新行业,将改变传统商业旧模式.根据相关数据显示,2010-2019年,我国电商交易规模从4.5万亿元增长到34.8万亿元,年均复合增速达25%.在电商飞速发展的态势下,物流行业也迎 ...

  8. 行业应用|工业AI视觉系统,助力物流行业智慧分拣加速升级

    近年来,电子商务的快速发展,致使快递业务量剧增,每天产生近三亿的包裹量.物品分拣作为工业流水线生产和物流领域中非常重要的一环,一直来由人工完成,速度较慢,准确率低,已经无法满足当下快递企业对产能.时效 ...

  9. 索尼录音笔怎么导出录音内容_搜狗新品发布,引领录音笔行业走向AI时代!

    今日(2月26日),搜狗公司举办了名为"同舟共记"的AI录音笔新品线上发布会.发布会上,搜狗除了正式发布S1.E1两款AI录音笔新品外,还与故宫宫廷文化合作推出了S1和C1 Pro ...

最新文章

  1. 21世纪初最有影响力的20篇计算机视觉期刊论文
  2. Matlab化简符号表达式
  3. docker重启容器命令
  4. linux-shell面试题 之二
  5. 学计算机高中选那三科,女生高中选哪三科最吃香
  6. 新加坡教育(20181101)
  7. Visual Studio 2013 详细安装教程(安装+注册)
  8. 文档理解最新技术介绍 | DAS 2020 Keynote Speech
  9. 使用fiddler抓取安卓模拟器包
  10. XMind 8破解教程
  11. VS 配置Directx
  12. python删除标点_python – 使用pandas快速删除标点符号
  13. 儿童计算机编程竞赛,一年获全国少儿编程比赛一等奖,他是怎么做到的?
  14. 《四》大话 TypeScript 泛型
  15. 3D游戏编程大师技巧读书笔记(第一章)
  16. freessl.cn ssl申请及windows安装
  17. 第八届蓝桥杯个人赛赛后总结
  18. java 完整子图_用JAVA求解最大连通子图
  19. 给一些女生提供公司常用的英文女生名字。分别从A-Z
  20. 全志h3通用固件_英菲克i7四核全志H3芯片刷机rom升级固件包

热门文章

  1. FZU-2239 Daxia Yayamao's problem(斜率优化)
  2. 声音均衡器怎么调好听_均衡器如何调,音乐更好听
  3. “瑞幸现象”背后的启示与警示
  4. 实现CEGUI中文汉字输入法光标跟随(C/C++源码)
  5. 2023.4月15日,晚3.35开始,又是睡不着的一晚
  6. pinyin4j学习笔记
  7. 分享:Word转PDF转换器有哪些?安利这3款好用工具
  8. java定义一个接口shape_java声明一个接口Shape2D用来实现二维几何形状类Circle和Rectangle。...
  9. nginx rewrite 跨域
  10. AttributeError: ‘module’ object has no attribute’xxx 问题解决