零基础入门CV赛事- 街景字符编码识别
零基础入门CV赛事- 街景字符编码识别 Task01
- 学习目标
- 数据介绍
- Task01任务内容
- 数据读取
- 解题思路
学习目标
- 熟悉计算机视觉赛事
- 完成典型的字符识别问题
- 掌握CV领域赛事的编程和解题思路
数据介绍
- 数据来自公开数据集 SVHN.
- 训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置
Task01任务内容
数据读取
使用json读取数据
import json
train_json = json.load(open('../data/input/train.json'))# 数据标注处理
def parse_json(d):arr = np.array([d['top'], d['height'], d['left'], d['width'], d['label']])arr = arr.astype(int)return arrimg = cv2.imread('../data/input/train/000000.png')
arr = parse_json(train_json['000000.png'])plt.figure(figsize=(10, 10))
plt.subplot(1, arr.shape[1]+1, 1)
plt.imshow(img)
plt.xticks([]); plt.yticks([])for idx in range(arr.shape[1]):plt.subplot(1, arr.shape[1]+1, idx+2)plt.imshow(img[arr[0, idx]:arr[0, idx]+arr[1, idx],arr[2, idx]:arr[2, idx]+arr[3, idx]])plt.title(arr[4, idx])plt.xticks([]); plt.yticks([]);
解题思路
- 定长字符识别:将所有样本统一看作是定长字符
- 不定长字符:难度增加,可利用例如典型的CRNN字符识别模型
- 检测再识别:先将字符的位置进行识别,在利用物体检测完成。
零基础入门CV赛事- 街景字符编码识别相关推荐
- 零基础入门CV赛事—街景字符编码识别—task2数据读取与扩增
数据读取与扩增 上节学习了街景字符编码识别的解题思路,让我们对本赛题有了基本的idea,这节在定长字符编码的思路基础上学习读取数据和数据扩增. 图像数据读取 由于赛题数据是图像数据,赛题的任务是识别图 ...
- 零基础入门CV赛事,理论结合实践
Datawhale干货 作者:阿水,Datawhale成员 本次分享的背景是,Datawhle联合天池发布的学习赛:零基础入门CV赛事之街景字符识别.本文以该比赛为例,对计算机视觉赛事中,赛事理解和B ...
- 零基础入门CV赛事-Task1 赛题理解
文章目录 赛题介绍 解题思路 1. 定长字符识别 2.不定长字符识别 3. 检测再识别 赛题介绍 赛题以街道字符为为赛题数据(比赛地址),该数据来自收集的SVHN街道字符,训练集数据包括3W张照片,验 ...
- 阿里云天池竞赛-零基础入门CV赛事-Task4 模型训练与验证
在上一章节我们构建了一个简单的CNN进行训练,并可视化了训练过程中的误差损失和第一个字符预测准确率,但这些还远远不够.一个成熟合格的深度学习训练流程至少具备以下功能: 在训练集上进行训练,并在验证集上 ...
- Datawhale 零基础入门CV赛事-Task5 模型集成
这里写目录标题 1.集成学习方法 2.深度学习中的集成学习 Dropout TTA Snapshot 1.集成学习方法 在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stac ...
- Datawhale 零基础入门CV赛事-Task4 模型训练与验证
文章目录 1.构造验证集 2.模型训练与验证 1.构造验证集 在机器学习模型(特别是深度学习模型)的训练过程中,模型是非常容易过拟合的.深度学习模型在不断的训练过程中训练误差会逐渐降低,但测试误差的走 ...
- Datawhale 零基础入门CV赛事-Task3 字符识别模型
文章目录 1.CNN实现 2.Pytorch实现CNN 3.使用ImangeNet预训练模型 1.CNN实现 CNN基础 2.Pytorch实现CNN 构建一个简单的CNN模型和训练过程 import ...
- Datawhale 零基础入门CV赛事-Task2 数据读取与数据扩增
文章目录 数据读取 图像读取 1.pillow 2.opencv 数据读取 数据扩增 数据读取 导入需要的包以及文件路径 import json, glob import numpy as np fr ...
- 零基础入门CV之街道字符识别----Task1赛题的理解
Datawhale 零基础入门CV赛事-Task1 赛题理解 本章内容将会对街景字符识别赛题进行赛题背景讲解,对赛题数据的读取进行说明,并给出集中解题思路. 1 赛题理解 赛题名称:零基础入门CV之街 ...
最新文章
- Science:AI领域那么多引人注目的「进展」,竟是无用功
- Openstack_通用技术_RPC 远程异步调用
- html选中radio隐藏div,radio类型的input标签选中后隐藏其他元素
- windows10中的Ubuntu
- Bootstrap鼠标悬停下拉导航总结
- oracle游标多线程,多线程jdbc游标分页查询原理 oracle和mysql分页
- HTML5给我们带来了什么
- VMware 虚拟化平台规划设计方案
- 编写绘图代码的技巧(二)
- nginx反向代理/负载均衡MySQL
- 有没有知道如何连接DB2的数据库?
- pywifi 破解WiFi密码
- 中国搜索20年:巨头百度的兴衰密码
- akshare复权算法-港股复权后数据代码分享
- 支付宝接口对接指南(四、回调通知对接:websoket方式)【保姆级】
- 如何实现高效的室内定位和追踪?
- c++小游戏 走迷宫
- sqlplus登录缓慢的解决
- excel对不同岗位进行名次排序
- (中篇)中高级前端大厂面试秘籍,寒冬中为您保驾护航,直通大厂