图像识别作为深度学习算法的主流实践应用方向,早已在生活的各个领域发挥作用,如安全检查和身份核验时的人脸识别、无人货架和智能零售柜中的商品识别,这些任务背后的关键技术都在于此。

图1 PP-ShiTu应用于商品识别效果示意(开发者应用展示)

然而实现理想的识别效果并不是一件简单的事:

  • 针对海量数据问题而言,如何实现一个通用的方法在不同的数据集中都有很好的表征能力?

  • 不同物体间的差别可能极其微小,即使是同种物体,也会受到外界干扰呈现不同形态,究竟如何进行有效区分?

  • 识别需求更新频繁,使用单一的分类或者检测模型只能不断增加训练集重训模型,怎样才能降低开发成本,快速跟上迭代步伐?

PP-ShiTu核心技术解读

针对以上技术难点,PaddleClas推出的通用图像识别系统PP-ShiTu均可以完美解决,它不仅有高水平的特征学习能力,对新出现的类别也可以在不用重新训练算法的情况下,直接通过配置检索库的方式实现识别。

⭐ 项目链接 ⭐

https://github.com/PaddlePaddle/PaddleClas

PaddleClas所有源码及教程均已开源,欢迎大家使用,并Star鼓励~

这样的特殊能力,得益于PP-ShiTu引入目标检测、度量学习、图像检索等技术,并将每个模块性能最大化,才构建成了统一、通用的图像识别系统:

图2 PP-ShiTu架构示意图

  • 主体检测:不同于一般的目标检测,主体检测是将目标物体和背景区分开来,能够有效减少干扰特征。PP-ShiTu中所采用的是目标检测模型PP-PicoDet,不仅预测速度超快,精度上也达到了SOTA,为后续的准确识别打下坚实基础;

图3 PP-PicoDet在 COCO2017-val上的 mAP 对比

  • 特征提取:作为图像识别系统的重点工作,PP-ShiTu是采用CPU级轻量化骨干网络PP-LCNet,并结合度量学习arcmargin算法,对高相似物体的区分效果远超单一模型,不仅准确率超越大模型ResNet50,预测速度还能快3倍!再加上经过18w类数据集打磨的预训练权重,不用再费心选择,一个模型就可以实现多场景覆盖。

图4 训练数据及部分测试数据示例

  • 向量检索:不同于单一模型直接输出类别信息,对于未知类别只有模型重训一个选择,耗时又耗力。PP-ShiTu引入向量检索,通过计算目标物体和检索库中图像的相似度来输出类别信息,一次训练长期使用,高效又便捷。

图5 端侧新类别建立索引流程(开发者应用展示)

升级版PP-ShiTu欢迎使用

时隔数月,PaddleClas 新版本v2.3.1为大家带来了更加轻量化的图像识别系统PP-ShiTu。核心功能点如下:

  • 升级版PP-ShiTu大小仅18M,完美支持移动端需求

  • 支持基于C++的服务化部署,部署效率大幅提升

  • 支持移动端Paddle Lite部署教程,手机上也能轻松实现图像识别

图6 手机识别效果展示(开发者应用展示)

PP-ShiTu的使用也是十分简单、方便,在完成环境配置后只需三步即可完成快速体验:

第一步:下载 Inference 模型

第二步:构建索引

第三步:完成单张/批量图像识别

详细文档,请参考:

https://github.com/PaddlePaddle/PaddleClas/blob/release/2.3/docs/zh_CN/quick_start/quick_start_recognition.md

更有完整流程演示,可参考AI Studio项目:https://aistudio.baidu.com/aistudio/projectdetail/3445604

共建开源生态

自PP-ShiTu发布以来,引起了众多开发者的广泛关注。华东理工大学的高材生颜鑫,也是飞桨领航团的团长,带领团队基于PP-ShiTu开发了一套智能购物平台系统:通过图像即可精准识别顾客购买的商品,并返回完整的购物清单及应付价格,为智能货柜提供了非常好的视觉化解决方案。

链接指路:

https://github.com/thomas-yanxin/Smart_container

图7 智能结算平台架构示意图

与此同时,我们也力求为开源社区的繁荣作出贡献,希望PP-ShiTu的算法本身以及优化思路,可以在给业界开发者带来更好网络的同时,也带来更多的算法优化启发,为中国的开源发展贡献一份力量。

微信扫描二维码添加运营小姐姐,添加成功后,回复暗号【c】,即可收到邀请官方交流群邀请,在这里您可以获得更高效的问题答疑,与各行各业开发者充分交流,期待您的加入!

如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

官网地址:

https://www.paddlepaddle.org.cn

PaddleClas项目地址:

GitHub:

https://github.com/PaddlePaddle/PaddleClas/tree/develop

Gitee:

https://gitee.com/paddlepaddle/PaddleClas

这么强大、用心的项目 ,还不赶紧给各位开发者一个Star

18M 超轻量图像识别系统,商品、车辆、人脸识别一网打尽!相关推荐

  1. 自动售卖系统开发系列——人脸识别自动售卖机三代BrotherSharp

    大纲: 售卖机三代BrotherSharp的简介 售卖机三代BrotherSharp的方案介绍    #系统整体组成    #软件平台    #硬件平台 售卖机三代BrotherSharp的实现过程 ...

  2. 自动售卖系统开发系列——人脸识别自动售卖机二代ChingTom

    大纲: 售卖机二代ChingTom的简介 售卖机二代ChingTom的方案介绍    #系统整体组成    #软件平台    #硬件平台 售卖机二代ChingTom的实现过程    #业务逻辑介绍   ...

  3. springBoot redis开发的Java快递代拿系统(含人脸识别,验证码登录)

     源码获取:我的博客资源页面可以下载!!!! 项目名称 springBoot redis开发的Java快递代拿系统(含人脸识别,验证码登录) 系统介绍 快递代拿系统 > 该项目使用当前最为流行的 ...

  4. 人脸识别小区门禁系统_小区人脸识别门禁系统安全吗?

    人脸识别门禁系统主要是通过上传人脸图片,通过系统算法采集人脸特征,然后储存在人脸特征数据库上.当有人员通过时,摄像头抓取人脸图片与后台庞大的人脸模板进行对比,确认是否是社区或楼层住户就可以自由通行.获 ...

  5. 门禁系统如何规避人脸识别数据使用风险?

    项目场景: 人脸识别在门禁场景得到广泛应用,尤其今年以来,因疫情防控的需要,带有人脸识别功能得数字哨兵和健康核验终端加速推广使用.虽然人脸识别相关智慧生态圈不断扩容,但充分保障个人隐私.确保安全应是前 ...

  6. 人工智能人脸识别系统,人工智能应用人脸识别

    手机人脸识别的原理是什么? . 不同品牌机型采用的面部识别技术方案不同,面部识别效果也会不一样:目前vivo/iQOO系列手机,仅NEX双屏版采用3D人脸识别技术,其余机型均采用FaceWake面部识 ...

  7. 动态人脸识别系统服务器,动态人脸识别监控管理平台的设计与实现

    摘要: 动态人脸视频监控是计算机视觉领域一个新兴的应用方向和备受关注的前沿课题,它结合了计算机科学,机器视觉,图像处理,模式识别,人工智能等多学科技术知识.国内外的动态人脸识别监控系统都非常注重系统运 ...

  8. python人脸识别门禁系统毕设_人脸识别门禁系统 毕业设计 可移植树莓派

    [实例简介] 基于python的人脸识别门禁系统,实现对人脸的录入与识别功能 ,毕业设计 附论文 可移植树莓派 [实例截图] [核心代码] 人脸识别毕业设计源码 └── 人脸识别毕业设计源码 ├── ...

  9. python人脸识别门禁系统_树莓派人脸识别门禁系统图文教程

    前面发布了人脸识别门禁系统的系列视频教程,现在补上图文版,方便查看指令和代码,这篇文章也是对之前的文章的更新与完善. 本系统中树莓派调用百度智能云人脸识别API,实现人脸识别门禁,主要分为三个模块来实 ...

最新文章

  1. 十个效果酷炫的Linux系统操作指令(像黑客帝国般的效果~)
  2. 独家 | 基于Python的遗传算法特征约简(附代码)
  3. 6月8日云栖精选夜读丨阿里云宣布与国内规模最大的汽车企业上汽集团合作
  4. LINUX系统以及ANDROID 平台log信息输出级别设置 [MTK]
  5. Bootstrap4+MySQL前后端综合实训-Day09-PM【实训汇报、在同一校园网下,查看别人的项目——ipconfig】
  6. 暑期项目经验(九) -- request session application
  7. Mysql代码生成器转Oracle代码生成
  8. 设置office首字母不变大小的手段
  9. 【kafka】kafka 控制台 消费 ip 却找 域名 报错 Can‘t resolve address UnresolvedAddressException
  10. mysql------事务
  11. python—day01_环境安装
  12. webRTC:jssip登录freeswitch的正确办法及代码
  13. 基于51单片机ADC0808自动数字电压表仿真数码管显示
  14. 3dmax中slice plane切割平面的作用
  15. 新玺配资:板块轮动加快 多看少动均衡配置为主
  16. MATLAB | 迟到的圣诞树绘制
  17. 离职员工揭露腾讯微博之死:因为No zuo所以Die
  18. Tips_linux
  19. php的chunk_split,php函数chunk_split详解
  20. 搭建各类游戏如何选择合适的服务器

热门文章

  1. 关于SpringOpenSessionInViewFilter的配置及处理方案
  2. 工作日志之误用篇 工作日志之目的
  3. Easy Deep Learning——卷积层
  4. 2019网络直播稳中有变:直播带货火出圈 5G带来弯道超车新机会
  5. uni-app 遮罩层事件穿透解决办法catchtouchmove
  6. 投影仪家用哪个牌子好?如何选择投影仪
  7. Canvas入门教学(3)图片与文字的绘制
  8. 拓嘉恒业:拼多多新品如何推广
  9. wps批量图片居中,编号
  10. Window系统电脑登录过个微信方法,微信多开(实测)