零基础入门CV赛事- 街景字符编码识别 Task01

  • 学习目标
  • 数据介绍
  • Task01任务内容
    • 数据读取
    • 解题思路

学习目标

  1. 熟悉计算机视觉赛事
  2. 完成典型的字符识别问题
  3. 掌握CV领域赛事的编程和解题思路

数据介绍

  1. 数据来自公开数据集 SVHN.
  2. 训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置

Task01任务内容

数据读取

使用json读取数据

import json
train_json = json.load(open('../data/input/train.json'))# 数据标注处理
def parse_json(d):arr = np.array([d['top'], d['height'], d['left'],  d['width'], d['label']])arr = arr.astype(int)return arrimg = cv2.imread('../data/input/train/000000.png')
arr = parse_json(train_json['000000.png'])plt.figure(figsize=(10, 10))
plt.subplot(1, arr.shape[1]+1, 1)
plt.imshow(img)
plt.xticks([]); plt.yticks([])for idx in range(arr.shape[1]):plt.subplot(1, arr.shape[1]+1, idx+2)plt.imshow(img[arr[0, idx]:arr[0, idx]+arr[1, idx],arr[2, idx]:arr[2, idx]+arr[3, idx]])plt.title(arr[4, idx])plt.xticks([]); plt.yticks([]);

解题思路

  1. 定长字符识别:将所有样本统一看作是定长字符
  2. 不定长字符:难度增加,可利用例如典型的CRNN字符识别模型
  3. 检测再识别:先将字符的位置进行识别,在利用物体检测完成。

零基础入门CV赛事- 街景字符编码识别相关推荐

  1. 零基础入门CV赛事—街景字符编码识别—task2数据读取与扩增

    数据读取与扩增 上节学习了街景字符编码识别的解题思路,让我们对本赛题有了基本的idea,这节在定长字符编码的思路基础上学习读取数据和数据扩增. 图像数据读取 由于赛题数据是图像数据,赛题的任务是识别图 ...

  2. 零基础入门CV赛事,理论结合实践

    Datawhale干货 作者:阿水,Datawhale成员 本次分享的背景是,Datawhle联合天池发布的学习赛:零基础入门CV赛事之街景字符识别.本文以该比赛为例,对计算机视觉赛事中,赛事理解和B ...

  3. 零基础入门CV赛事-Task1 赛题理解

    文章目录 赛题介绍 解题思路 1. 定长字符识别 2.不定长字符识别 3. 检测再识别 赛题介绍 赛题以街道字符为为赛题数据(比赛地址),该数据来自收集的SVHN街道字符,训练集数据包括3W张照片,验 ...

  4. 阿里云天池竞赛-零基础入门CV赛事-Task4 模型训练与验证

    在上一章节我们构建了一个简单的CNN进行训练,并可视化了训练过程中的误差损失和第一个字符预测准确率,但这些还远远不够.一个成熟合格的深度学习训练流程至少具备以下功能: 在训练集上进行训练,并在验证集上 ...

  5. Datawhale 零基础入门CV赛事-Task5 模型集成

    这里写目录标题 1.集成学习方法 2.深度学习中的集成学习 Dropout TTA Snapshot 1.集成学习方法 在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stac ...

  6. Datawhale 零基础入门CV赛事-Task4 模型训练与验证

    文章目录 1.构造验证集 2.模型训练与验证 1.构造验证集 在机器学习模型(特别是深度学习模型)的训练过程中,模型是非常容易过拟合的.深度学习模型在不断的训练过程中训练误差会逐渐降低,但测试误差的走 ...

  7. Datawhale 零基础入门CV赛事-Task3 字符识别模型

    文章目录 1.CNN实现 2.Pytorch实现CNN 3.使用ImangeNet预训练模型 1.CNN实现 CNN基础 2.Pytorch实现CNN 构建一个简单的CNN模型和训练过程 import ...

  8. Datawhale 零基础入门CV赛事-Task2 数据读取与数据扩增

    文章目录 数据读取 图像读取 1.pillow 2.opencv 数据读取 数据扩增 数据读取 导入需要的包以及文件路径 import json, glob import numpy as np fr ...

  9. 零基础入门CV之街道字符识别----Task1赛题的理解

    Datawhale 零基础入门CV赛事-Task1 赛题理解 本章内容将会对街景字符识别赛题进行赛题背景讲解,对赛题数据的读取进行说明,并给出集中解题思路. 1 赛题理解 赛题名称:零基础入门CV之街 ...

最新文章

  1. Science:AI领域那么多引人注目的「进展」,竟是无用功
  2. Openstack_通用技术_RPC 远程异步调用
  3. html选中radio隐藏div,radio类型的input标签选中后隐藏其他元素
  4. windows10中的Ubuntu
  5. Bootstrap鼠标悬停下拉导航总结
  6. oracle游标多线程,多线程jdbc游标分页查询原理 oracle和mysql分页
  7. HTML5给我们带来了什么
  8. VMware 虚拟化平台规划设计方案
  9. 编写绘图代码的技巧(二)
  10. nginx反向代理/负载均衡MySQL
  11. 有没有知道如何连接DB2的数据库?
  12. pywifi 破解WiFi密码
  13. 中国搜索20年:巨头百度的兴衰密码
  14. akshare复权算法-港股复权后数据代码分享
  15. 支付宝接口对接指南(四、回调通知对接:websoket方式)【保姆级】
  16. 如何实现高效的室内定位和追踪?
  17. c++小游戏 走迷宫
  18. sqlplus登录缓慢的解决
  19. excel对不同岗位进行名次排序
  20. (中篇)中高级前端大厂面试秘籍,寒冬中为您保驾护航,直通大厂

热门文章

  1. 前端知识的浅薄了解2
  2. mysql中授权主机通配的_什么意思_windows和linux虚拟机配置mysql主从
  3. 一个模仿微信群聊的H5页面
  4. 计算机三级网络技术第一章知识总结
  5. 最全中国科学技术大学计算机学院课程资源!
  6. 究竟什么是无卤PCB线路板?
  7. Linux 网络基础(二)---传输层
  8. 完全理解Unity中PreCompute Realtime GI及其优化(一)
  9. UItableView+Mansory自定义Cell小Demo
  10. java 实现VMware虚拟机创建