Pytorch应用之——人民币总结
由于实习原因,好久没有跟新博客了。今天总结一下参加tinymind人民币编码区识别比赛的经验跟代码。
人民币编码区识别比赛分为预赛与正赛。预赛很简单,识别纸币面额,我在前面的博客中讲述过,戳这里。
简单讲一下,由于纸币背景简单,识别面值其实就是简单的分类问题,我的方法就是直接把图像塞进resnet18里,结果正确率是可以达到100%的。代码在这儿。
主要介绍正赛,正赛是编码区识别。编码区的识别分为两个步骤。首先,我们要先把编码区找到,也就是将编码区从原图中裁剪出来。然后,通过裁剪出的图片以及它的编码区Label放入文本识别的框架里训练,获得模型,再test出结果。
编码区检测我使用了一些方法有目标检测也有文本Ocr的,如yolov3,EAST,CTPN。我从数据集中选取1500张来做它们的训练集,得出结果发现yolov3可以检测出来,但会出现检测不全的情况,EAST跟CTPN结果较好。原理不介绍了,我把yolov3的代码给大家戳这里。
其实编码区检测大家效果都差不多,主要区别还是在文本识别。我用的是cnn+LSTM+ctc。主要思路是,讲编码区图片输入,经CNN降采样获得一个适合LSTM的feature map,然后放入LSTM,使得每个宽度之间获得前后的关联信息,这样对识别效果会有好处,当然你也可以舍弃rnn(比赛中有人做过)。CNN部分我用的VGG的网络结构,但最终训练集正确率99%而验证机的准确率只有90左右,出现了过拟合情况。不知道有没有大神告诉我怎么才能避免这种情况。
大致过程如上,最终结果95左右,虽然不高,但也完成了。主要跟大家分享经验思想以及代码,希望对大家有帮助。
Pytorch应用之——人民币总结相关推荐
- 一流科技完成5000万人民币A轮融资,高瓴创投独家领投
2月4日,专注于人工智能基础设施软件的研发工作的一流科技宣布完成由高瓴创投独家领投的A轮融资,这是其两年来再次开放融资,融资总额5000万元人民币.本次融资将用于高端人才招募.核心产品研发和商业模式拓 ...
- 【数据竞赛】CV赛题总结:人民币面值与编码识别
CV 人民币面值与编码 在2019年6月份参加了TinyMind人民币面值及编码识别比赛,最终获得了面试识别并列第二.编码识别初赛第三/复赛第五的成绩,在文本我将分享这次比赛的历程和我的学习收获,比赛 ...
- dataset__getitem___[PyTorch 学习笔记] 2.1 DataLoader 与 DataSet
本章代码:https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson2/rmb_classification/ 人民币 二分类 ...
- PyTorch框架学习十七——Batch Normalization
PyTorch框架学习十七--Batch Normalization 一.BN的概念 二.Internal Covariate Shift(ICS) 三.BN的一个应用案例 四.PyTorch中BN的 ...
- PyTorch框架学习十五——可视化工具TensorBoard
PyTorch框架学习十五--可视化工具TensorBoard 一.TensorBoard简介 二.TensorBoard安装及测试 三.TensorBoard的使用 1.add_scalar() 2 ...
- Pytorch —— 学习率调整策略
1.为什么要调整学习率 学习率控制梯度更新的快慢,在训练中,开始时的学习率比较大,梯度更新步伐比较大,后期时学习率比较小,梯度更新步伐比较小. 梯度下降:wi+1=wi−g(wi)w_{i+1}=w_ ...
- pytorch —— transforms图像增强(一)
1.数据增强(data augmentation) 数据增强又称为数据增广,数据扩增,它是对训练集进行变换,使训练集更丰富,从而让模型更具泛化能力. 在中学阶段就已经接触过数据增强的概念,看一个例子, ...
- pytorch —— 图像预处理模块(Transforms)
transforms运行机制 torchvision是pytorch的计算机视觉工具包,在torchvision中有三个主要的模块: torchvision.transforms,常用的图像预处理方法 ...
- 用英伟达Jetson Nano运行PyTorch Fast.ai丨手把手教程+第三方工具
原作 Interogativ 郭一璞 编译 量子位 报道 | 公众号 QbitAI 英伟达Jetson Nano,作为老黄家最便宜的硬件,只要99美元. 看到便宜就想捡,拿到手里怎么玩? 造机器人 ...
最新文章
- 【翻译自mos文章】怎么正确的计算一个ip地址的subnet id?
- pytorch focal loss
- seg显示时间——51程序
- wp7技术类网站汇总
- h5 server send event(sse)
- python beautifulsoup4_Python之Beautiful Soup 4使用实例
- VSAN效能监控利器-VSAN Observer
- Linux下ping加上时间戳
- 解决vmware“二进制转换与此平台长模式不兼容.....”的问题
- es6 modules 和commonjs
- 如何找到网站服务器的源代码_如何花3-5分钟找到网站Bug?
- Android 用户界面---拖放(Drag and Drop)(三)
- 跟人合作人工智能,方案没有,钱又不出,这怎么合作?
- 计算机wifi共享怎么设置,笔者教你win7如何设置wifi共享
- 回眸 2020,展望 2021
- “先进”的飞书为何搞不定钉钉?
- hdu6438(优先队列)
- python爬虫-抓取内涵吧内涵段子
- php 检测分辨率,浏览器分辨率检测,屏幕分辨率检测
- DHCP地址池耗尽攻击