本文已在飞桨公众号发布,查看请戳链接:
30倍加速,3毫秒极速识别,人、车、OCR等9大识别任务一网打尽

人脸、车辆、人体属性、卡证、交通标识等经典图像识别能力,在我们当前数字化工作及生活中发挥着极其重要的作用。业内也不乏顶尖公司提供的可直接调用的API、SDK,但这些往往面临着定制化场景泛化效果不好、价格昂贵、黑盒可控性低、技术壁垒难以形成多诸多痛点。

而今天小编要给大家推荐的是一个完全开源免费的、覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码就可实现迭代训练的项目PaddleClas!

图1 PaddleClas图像分类应用示意图

话不多说,赶紧送上传送门,识货的小伙伴赶紧尝试一下吧!

点击GET链接

记得Star收藏防止走丢哦!

https://github.com/PaddlePaddle/PaddleClas

下面小编就来详细拆解下这个项目的过人之处吧!

图2 9大场景模型效果示意图

亮点一

完美平衡精度与速度

从大名鼎鼎的Resnet50到如今火热的Swin-Transformer,模型精度不断被刷新,但是预测效率并不高。即使是Swin-Transformer最小的模型,在CPU上的预测速度也超过100ms,远远无法满足产业实时预测的需求。

而使用MobileNet系列等轻量化模型可以保证较高的预测效率,在CPU上预测一张图像大约3ms,但是模型精度往往和大模型有很大差距。

PaddleClas推出的超轻量图像分类方案(Practical Ultra Light Classification,简称PULC),就完美解决上述产业落地中算法精度和速度难以平衡的痛点。

表1 不同模型精度速度结果对比

如图所示,它的精度与Swin-Transformer等大模型比肩,预测速度却可以快30倍以上,在CPU上的推理时长仅需2ms

亮点二

易用性极强

PULC方案不仅完美地平衡了精度与速度,还充分考虑了产业实践过程中需要定制化的对算法快速迭代的需求,只需一行命令,就可完成模型训练。

与此同时,PaddleClas 团队还发布了包括人、车、OCR在内的9大场景模型,仅需2步就能实现业务 POC 效果验证,训练、推理、部署一条龙,真正实现“开箱即用”。

不仅如此,项目还匹配了详细的中文使用文档及产业实践范例教程。

图3 使用文档及范例示意图

亮点三

集成超多硬核技术

超轻量图像分类方案(PULC)集成了业界4大业界领先的优化策略:

图4 超轻量图像分类方案(PULC)示意图

PP-LCNet轻量级骨干网络

PP-LCNet作为针对CPU量身打造的骨干网络模型,在速度、精度方面均远超如MobileNetV3等同体量算法,多个场景模型优化后,速度较SwinTransformer的模型快30倍以上,精度较MobileNetV3_small_0.35x高18个点

SSLD预训练权重

SSLD半监督蒸馏算法可以使小模型学习到大模型的特征和ImageNet22k无标签大规模数据的知识。在训练小模型时,使用SSLD预训练权重作为模型的初始化参数,可以使不同场景的应用分类模型获得1-2.5个点的精度提升。

数据增强策略集成

该方案融合了图像变换、图像裁剪和图像混叠3种数据增强方法,并支持自定义调整触发概率,能使模型的泛化能力大大增强,提升模型在实际场景中的性能。模型可以在上一步的基础上,精度再提升1个点左右。

SKL-UGI知识蒸馏算法

SKL(symmetric-KL)在经典的KL知识蒸馏算法的基础上引入对称信息,提升了算法的鲁棒性。同时,该方案可以方便地在训练中加入无标签训练数据(Unlabeled General Image),可以进一步提升模型效果。该算法可以使模型精度继续提升1-2个点。

服务真实场景需求

20种产业算法落地方案

不仅如此,PaddleClas团队考虑到真实产业应用面对的各种软硬件环境和不同的场景需求,在提供PULC方案的同时,还提供了包括3种训练方式、5种训练环境、3种模型压缩策略和9种推理部署方式在内的20种产业算法落地方案

表2 PaddleClas训练推理部署功能支持列表

其中值得高度关注的有:

01 分布式训练

飞桨分布式训练架构具备4D混合并行、端到端自适应分布式训练等多项特色技术。在PP-LCNet训练中,4机8卡相较于单机8卡加速比达到3.48倍,加速效率87%,精度无损。

02 模型压缩

飞桨模型压缩工具PaddleSlim功能完备,覆盖模型裁剪、量化、蒸馏和NAS。图像分类模型经过量化裁剪后,移动端平均预测耗时减少24%。

03 移动端/边缘端部署

飞桨轻量化推理引擎Paddle Lite适配了20+ AI 加速芯片,可以快速实现图像分类模型在移动设备、嵌入式设备和IOT设备等高效设备的部署。

以上所有模型、代码均在PaddleClas中开源提供,还有超详细文档教程和范例项目,赶紧查看全部开源代码并Star收藏吧~

链接指路

https://github.com/PaddlePaddle/PaddleClas

直播课程预告

内含惊喜福利

为了让开发者们更深入地了解PaddleClas这次 发布的全新内容,解决落地应用难点,掌握产业实践的核心能力,6月15-6月17日晚20:30,飞桨团队精心准备了为期三天的直播课程!

百度资深工程师将为我们详细介绍超轻量图像分类方案,对各场景模型优化原理及使用方式进行拆解,之后还有产业案例全流程实操,对各类痛难点、解决方案进行手把手教学,加上直播现场互动答疑,还在等什么!抓紧入群上车吧!

关注飞桨公众号,入群GET惊喜好礼

入群福利

  • 获取PaddleClas详解本次升级内容的直播课链接

  • 获取PaddleClas团队整理的10G重磅图像分类学习大礼包,包括:

图5 PaddleClas入群礼包内容示意

更多阅读

  • 官网地址:

https://www.paddlepaddle.org.cn

  • PaddleClas项目地址:

GitHub: https://github.com/PaddlePaddle/PaddleClas

Gitee: https://gitee.com/paddlepaddle/PaddleClas

关注【飞桨PaddlePaddle】公众号
获取更多技术内容~

30倍加速,3毫秒极速识别,人、车、OCR等9大识别任务一网打尽相关推荐

  1. 按键精灵 百度文字识别(百度ocr)OCRSpace文字识别

    目录 1. 申请百度OCR服务 1.1. 百度OCR登录 1.2 创建新应用 1.3 免费领取次数 1.3 查看是否创建成功 2. 按键精灵运用百度OCR接口 2.1 通用文字识别(高精度版)文档 2 ...

  2. 蓝奏云数值验证码识别,python调用虹鱼图灵识别插件,超高正确率

    识别验证码一直是本人想要做的事情,一直在接触按键精灵,了解到有一个虹鱼图灵识别插件专门做验证码和图像识别,原理就是图片处理和制作字库识别,制作字库我一直觉得很麻烦,工程量太大.不管怎样,它能用能达到我 ...

  3. 验证码识别的原理python_蓝奏云数值验证码识别,python调用虹鱼图灵识别插件,超高正确率...

    本帖最后由 打字的小强 于 2020-6-5 13:11 编辑 识别验证码一直是本人想要做的事情,一直在接触按键精灵,了解到有一个虹鱼图灵识别插件专门做验证码和图像识别,原理就是图片处理和制作字库识别 ...

  4. 一句话加速grep近30倍

    生物信息学习的正确姿势 NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞测序分析  ...

  5. java 下载加速_Java实现大文件下载,提速30倍!想学?我教你啊!

    前言 兄弟们看到这个标题可能会觉得是个标题党,为了解决疑虑,我们先来看下最终的测试结果: 测试云盘下载的文件 46M,自己本地最大下载速度 2M 1. 单线程下载,总耗时: 603s img 2. 多 ...

  6. 百倍加速!Python量化策略的算法性能提升指南

    性能问题 Python在2016年里可以说是风靡国内量化投资圈,目前整个生态链已经初具规模: 交易:vn.py.easytrader.at_py 数据:tushare 回测:rqalpha 在线平台: ...

  7. 百倍加速:Python量化策略的算法性能提升指南

    性能问题 Python在2016年里可以说是风靡国内量化投资圈,目前整个生态链已经初具规模: 交易:vn.py.easytrader.at_py 数据:tushare 回测:rqalpha 在线平台: ...

  8. 预览速度提升30倍,这是什么黑科技?(天猫618之3D渲染篇)

    简介: 天猫618宣布的 3D 购物时代,相信有很多小伙伴好奇,这背后有哪些"黑科技"?橙子从以下三点为你揭秘--3D实景复刻.3D渲染.3D算法,上周讲了<天猫618宣布开 ...

  9. 国内首款 FPGA 云服务器,性能是通用 CPU 服务器 30 倍以上

    2019独角兽企业重金招聘Python工程师标准>>> 版权声明:本文由薛梁 原创文章,转载请注明出处:  文章原文链接:https://www.qcloud.com/communi ...

最新文章

  1. C#String.PadLeft函数,文本对齐以及填补解决方案
  2. c++控制台下输出sin函数图形
  3. hadoop+spark生态系统操作与指南非影印版_Spark背景知识学习
  4. TensorFlow学习笔记(十三)TensorFLow 常用Optimizer 总结
  5. [ISSUE]invalid 'cobj' in function 'lua_cocos2dx_EventDispatcher_dispatchCustomEvent'
  6. Robot Framework(4)——Selenium2Library关键字
  7. iPhone Objective-C EXC_BAD_ACCESS问题
  8. JavaScript系列--类型判断的4种基本方法,研究jquery的type方法,空对象的检测方法,类数组对象...
  9. 修改pip默认安装位置
  10. 域名过期导致的问题-研究DNS相关知识
  11. 当前地震预测研究的状况报告
  12. 联想台式计算机亮度怎么调,Lenovo笔记本电脑如何调节屏幕亮度
  13. ARM开发(二)ARM体系结构——ARM,数据和指令类型,处理器工作模式,寄存器,状态寄存器,流水线,指令集,汇编小练习题
  14. JAVA客户端调用SAP提供的接口(保姆级教程)
  15. 使用Ventoy安装Deepin系统出现Error verification failed 0x1A Security violation错误
  16. “云上进化——2022全球AI生物制药大赛”来袭,30万奖池等你来战!
  17. mysql闰秒_闰秒导致MySQL服务器的CPU sys过高
  18. fst 共享后缀_关于Lucene的词典FST深入剖析
  19. 如何构建基于 Web Excel 组件的指标补录平台
  20. 怎么测试t470p性能软件,【ThinkPadT470p(20J6002YCD)评测】高性能商务本的新选择 ThinkPad T470p评测-中关村在线...

热门文章

  1. Angular.js ng-dblclick ng-click
  2. 鸿蒙升级报名,如何报名升级鸿蒙系统
  3. CSS3打造的10种创意动画菜单效果
  4. SUSE zypper 本地源配置
  5. IsolatedStorage
  6. 数据库常见面试题(带答案,开发者必看)
  7. 吃瓜教程task01 第1章 绪论
  8. 达娃商标之争结束 娃哈哈商标归娃哈哈集团
  9. flutter报错Navigator operation requested with a context that does not include a Navigator
  10. junit4 测试方法 设置自动回滚 数据