我国电力行业发展迅速,电表作为测电设备经历了普通电表、预付费电表和智能电表三个阶段的发展。在产业场景中,表的种类多达十几种,过去依赖人工抄表,成本很高。如果能够采集到大量电表图片,借助人工智能技术批量检测和识别,将会大幅提升效率。

本次飞桨产业实践范例库开源电表读数识别场景应用,提供了从数据准备、技术方案、模型训练优化,到模型部署的全流程可复用方案,降低产业落地门槛。

⭐项目链接⭐

https://github.com/PaddlePaddle/awesome-DeepLearning

所有源码及教程均已开源,欢迎大家使用,star鼓励~

基于深度学习技术

实现电表读数识别

本场景要解决多类别电表识别任务,从技术上需要对多种类别的电表表数和表号进行检测再识别,从数据到模型面临着多重问题。

项目难点:

  • 在数据方面,电表种类多、数据少、拍摄角度多样且部分数据反光严重。

  • 如何从零标注电表数据,选择何种标注软件能够最快速度构建数据集?

  • 技术路线的选择也面临多方面的问题,例如是通过文字检测来反向微调,还是通过目标检测从零训练?

本项目将一一解决这些难点。

项目方案:

基于上述难点,飞桨开发者技术专家不断进行尝试,最终选用了飞桨文字识别套件PaddleOCR中的PP-OCR模型进行了微调与优化,其检测部分基于DB的分割方法实现,直接解决了电表数据中的倾斜问题,通过再造数据集来扩充识别数据集,训练识别模型。PP-OCR模型经过大量实验,其泛化性也足以支撑复杂垂类场景下的效果。

在数据标注工具上,使用PPOCRLabel实现半自动标注,内嵌PP-OCR模型,一键实现机器自动标注,且具有便捷的修改体验。支持四点框、矩形框标注模式,导出格式可直接用于PaddleOCR训练,标注效率显著提升。

方案优化:

在优化方面,首先对PP-OCR模型的检测部分进行初步微调,然后通过对数据的进一步分析,发现原始图像分辨率较大,进而调整EastRandomCropData的尺寸,放大输入模型前的图像尺度。通过CopyPaste数据增强解决数据量小的问题,并且根据实际情况调小学习率。

项目效果:

最终在评测数据集上从原先的Hmeans=0.3优化到0.85。除此之外,本项目也尝试了一部分目标检测算法。具体的优化过程和详细解释,欢迎大家关注直播!

微调前后对比

部署方面使用飞桨原生推理库Paddle Inference完成,满足用户批量预测、数据安全性高、延迟低的需求,快速在本地完成部署方案。

产业实践范例教程

助力企业跨越AI落地鸿沟

飞桨产业实践范例,致力于加速AI在产业落地的前进路径,减少理论技术与产业应用的差距。范例来源于产业真实业务场景,通过完整的代码实现,提供从数据准备到模型部署的方案过程解析,堪称产业落地的“自动导航”。

  • 真实产业场景:与实际具有AI应用的企业合作共建,选取企业高频需求的AI应用场景如智慧城市-安全帽检测、智能制造-表计读数等;

  • 完整代码实现:提供可一键运行的代码,在“AI Studio一站式开发平台”上使用免费算力一键Notebook运行;

  • 详细过程解析:深度解析从数据准备和处理、模型选择、模型优化和部署的AI落地全流程,共享可复用的模型调参和优化经验;

  • 直达项目落地:百度高工手把手教用户进行全流程代码实践,轻松直达项目POC阶段。

精彩课程预告

为了让小伙伴们更便捷地应用电表读数范例教程,我们邀请了飞桨开发者技术专家于3月3日20:30-21:00为大家深度解析从数据准备、方案设计到模型优化部署的开发全流程,手把手教大家进行代码实践。

欢迎小伙伴们扫码进群,免费获取直播课和回放视频链接,更有机会获得覆盖智慧城市、工业制造、金融、互联网等行业的飞桨产业实践范例手册!也欢迎感兴趣的企业和开发者与我们联系,交流技术探讨合作。

扫码报名直播课,加入技术交流群

关注飞桨公众号,获取更多技术内容~

OCR产业应用实战,多类别电表读数识别方案详解相关推荐

  1. 智慧城市产业应用实践,高精度火灾烟雾检测方案详解

    据报道,2021年全国消防救援队伍共接报火灾74.8万起,死亡1987人,受伤2225人,直接财产损失67.5亿元.传统靠人工报警的方法存在人员管理难.场地数量多且分散等问题,无法有效发现险情降低火灾 ...

  2. 自动驾驶感知算法实战11——多传感器融合感知方案详解

    自动驾驶感知算法实战专栏:https://blog.csdn.net/charmve/category_12097938.html 目录 1 何为多传感器融合? 2 多传感器融合的优势 3. 多传感器 ...

  3. 分布式事务实战---XA两阶段提交(2PC)方案详解

    XA,2PC,two-phase commit protocol,两阶段事务提交采⽤的是 X/OPEN 组织定义的DTP 模型所抽象的: AP 应用程序,Application Program,定义事 ...

  4. 1 企业实战(3) Redis服务部署和配置详解 (资源)

    前言: 环境介绍: CentOS 7.5 Redis 5.0.0 gcc 下载: http://download.redis.io/releases/ 安装redis: [root@localhost ...

  5. OpenCV实战(16)——角点检测详解

    OpenCV实战(16)--角点检测详解 0. 前言 1. Harris 特征检测器 1.1 检测 Harris 角点 1.2 cv::cornerHarris 函数参数 2. 可追踪的良好特征 3. ...

  6. Keras深度学习实战(26)——文档向量详解

    Keras深度学习实战(26)--文档向量详解 0. 前言 1. 文档向量基本概念 2. 神经网络模型与数据集分析 2.1 模型分析 2.2 数据集介绍 3. 利用 Keras 构建神经网络模型生成文 ...

  7. Keras深度学习实战(22)——生成对抗网络详解与实现

    Keras深度学习实战(22)--生成对抗网络详解与实现 0. 前言 1. 生成对抗网络原理 2. 模型分析 3. 利用生成对抗网络生成手写数字图像 小结 系列链接 0. 前言 生成对抗网络 (Gen ...

  8. Keras深度学习实战(21)——神经风格迁移详解

    Keras深度学习实战(21)--神经风格迁移详解 0. 前言 1. 神经风格迁移原理 2. 模型分析 3. 使用 Keras 实现神经风格迁移 小结 系列链接 0. 前言 在 DeepDream 图 ...

  9. unity 3d shaderlab 开发实战详解_vue实战开发011:使用router-view嵌套路由详解

    前面已经把首页的顶部header和底部的footer页面写完,现在开始写内容区域了,在写内容之前我们先要将路由配置好,不然无法在页面上查看效果,所以这里我在components目录下先建了一个home ...

最新文章

  1. AutoShape:实时形状感知的单目3D目标检测(ICCV2021)
  2. 接口请求两次_事故分享之接口请求顺序错乱
  3. mysql和html的联系_前台与PHP与Mysql三者的联系
  4. ActiveMQ消息中间件简明笔记(1)——理论知识点整理
  5. 【转】Java学习---Java Web基础面试题整理
  6. 搭建开发环境tomcat起不来
  7. 聚焦核心竞争力:自建与外购
  8. C#高仿腾讯QQ截图程序
  9. voip和rtc_WebRTC与VoIP的对比
  10. php 判断是否是日文,php正则判断中文韩文的编码的例子
  11. 数据清洗_缺失值处理
  12. 2020西工大计算机考研经验贴
  13. your cuda software stack is old.we fall back to the NIVIDIA driver for some compilation. Update your
  14. Arduino检测外部电池电量方法
  15. [io_uring][自用] io_uring.pdf DeepL机翻
  16. 高德地图(实时获取定位)
  17. 阿里云RDS在线DDL工具gh-ost
  18. vue webapp之music(六)利用axios与后端接口代理请求歌单推荐数据
  19. 使用OpenCV实现一个文档自动扫描仪
  20. Eigenvalue of random matrix

热门文章

  1. 西电-2019模式识别研究生考试
  2. 关于相对论的一个问题
  3. 转载:稳定性,鲁棒性和非脆弱性的精辟解读
  4. Swing学习系列 -- Swing读书笔记目录
  5. unity之模糊背景(带你欣赏女人的朦胧美)
  6. AI快车道PaddleNLP系列直播课6|语义检索系统快速搭建落地
  7. 安装gym库_DRL环境安装:Win10+Anaconda+PyTorch+PyCharm+Gym
  8. 史上最全电子元器件知识讲解
  9. autoCAD2010 块属性
  10. 开火车的纸牌游戏-python版本