Datawhale干货

作者:王程伟,Datawhale成员

本文为干货知识+竞赛实践系列分享,旨在理论与实践结合,从学习到项目实践。(零基础入门系列:数据挖掘/cv/nlp/金融风控/推荐系统等,持续更新)

本文对计算机视觉赛事中,数据读取及数据扩增两部分内容进行解析,同时进行了直播答疑分享(今晚8点在阿里天池直播分享,录播上传后原链接可回看):

https://tianchi.aliyun.com/course/live?spm=5176.12586971.1001.1.11be6956fkKgJ8&liveId=41168

分享大纲

1. 图像读取

  • 常用图像读取的5种方法及其比较总结;

2. Pytorch数据读取

  • 介绍了常用数据集及自定义数据集读取的方法;

3. 数据扩增

  • 基于图像处理的数据扩增、基于深度学习的数据扩增及使用Pytorch的数据扩增。

图像读取

常用的图像数据读取方法如下:

  • 方法1:OpenCV-python

  • 方法2:Pillow

  • 方法3:matplotlib

  • 方法4:scipy

  • 方法5:skimage

  • 总结

Pytorch数据读取

Pytorch数据读取时分为常用数据集读取和自定义数据集读取两部分。

  • 常用数据集读取

  • 自定义数据集读取

数据扩增

数据扩增用于增加训练数据集,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力。常见的数据扩增方法有:基于图像处理的图像扩增、基于深度学习的图像扩增。

1. 基于图像处理的数据扩增

  • 几何变换

  • 灰色和彩色空间变换

  • 添加噪声和滤波

  • Mixing image(图像混合)

  • Random erasing(随机擦除)

2. 基于深度学习的数据扩增

3. 使用Pytorch进行数据增强

Datawhale竞赛群已成立

可扫码加入Datawhale竞赛学习社群

在社群中,交流、讨论和组队算法赛事。

如果加入了之前的社群,请不需要重复添加!

如需直播PPT,后台回复 CV直播 或进社群下载

点击阅读原文,视频分享↓

图像数据读取及数据扩增方法相关推荐

  1. 天池大赛:街景字符编码识别——Part2:数据读取与数据扩增

    街景字符编码识别 更新流程↓ Task01:赛题理解 Task02:数据读取与数据扩增 Task03:字符识别模型 Task04:模型训练与验证 Task05:模型集成 底到镜一 比赛链接 Part2 ...

  2. 计算机视觉实践(街景字符编码识别)-Task2 数据读取与数据扩增

    计算机视觉实践(街景字符编码识别)-Task2 数据读取与数据扩增 2.1.数据读取与数据扩增 本章主要内容为数据读取.数据扩增方法和Pytorch读取赛题数据三个部分组成. 2.1 学习目标 学习P ...

  3. 数据读取与数据扩增方法

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:樊亮.黄星源.Datawhale优秀学习者 本文对图像数据读取及图 ...

  4. 【深度学习】数据读取与数据扩增方法

    转载自:Datawhale,作者:樊亮.黄星源.Datawhale优秀学习者 本文对图像数据读取及图像数据扩增方法进行了总结,并以阿里天池零基础入门CV赛事为实践,利用Pytorch对数据进行了读取和 ...

  5. Datawhale 零基础入门CV赛事-Task2 数据读取与数据扩增

    文章目录 数据读取 图像读取 1.pillow 2.opencv 数据读取 数据扩增 数据读取 导入需要的包以及文件路径 import json, glob import numpy as np fr ...

  6. 数据读取与数据扩增理解

    1.图像读取 Python中有很多库可以完成数据读取的操作,比较常见的有Pillow和OpenCV. 1.1 Pillow Pillow是Python图像处理函式库(PIL)的一个分支.Pillow提 ...

  7. 【阿里云天池】实战:街景符号识别(数据读取与数据扩增)

    一.数据扩增 在深度学习中数据扩增方法非常重要,数据扩增可以增加训练集的样本,同时也可以有效缓解模型过拟合的情况,也可以给模型带来的更强的泛化能力. (1)数据扩增的作用 在深度学习模型的训练过程中, ...

  8. PyTorch系列 (二): pytorch数据读取自制数据集并

    PyTorch系列 (二): pytorch数据读取 PyTorch 1: How to use data in pytorch Posted by WangW on February 1, 2019 ...

  9. R语言数据读取以及数据保存

    一.R语言读取文本文件: 1.文件目录操作: getwd() : 返回当前工作目录 setwd("d:/data")  更改工作目录 2.常用的读取指令read read.tabl ...

最新文章

  1. 三代测序数据纠错的方法、装置和计算机可读存储介质与流程
  2. ubuntu通过apt-get方式搭建lnmp环境以及php扩展安装
  3. python发明者叫什么-python是怎么被发明的
  4. ORM的概念, ORM到底是什么
  5. 《C语言编程魔法书:基于C11标准》——第一篇 预备知识篇 第1章 C魔法概览1.1 例说编程语言...
  6. MongoDB内置文档查看和修改
  7. java 死锁种类_用java写一个死锁
  8. 华为交换机如何通过tftp服务器上传下载文件
  9. endnote一打开就自动关闭_【EndNote文献管理】5分钟快速上手Endnote
  10. modulenotfounderror python_python程序在命令行执行提示ModuleNotFoundError: No module named 'XXX' 解决方法...
  11. 现在人真的很奇怪,看见有钱人点头哈腰
  12. ODAC(V9.5.15) 学习笔记(四)TCustomDADataSet(1)
  13. selenium无法调用chrome或者firefox的原因
  14. hive 建表_大数据面试必备 | Hive数据仓工具面试题!
  15. 变异数分析_人工智能系统中分析变异的祸害
  16. elastix中NAT穿越问题解决办法
  17. 【JavaScript 红宝书】JavaScript 高级教程第 3 版学习笔记
  18. 兴业银行紧急核查国美贷款
  19. 知道创宇优质混合云解决方案,点击了解~
  20. mysql中字符串拼接函数_MySQL 字符串连接CONCAT()函数

热门文章

  1. cached-query 将缓存和查询数据库高速连接起来的轻类库
  2. HDU2594 KMP next数组的应用
  3. 测试用例设计白皮书--正交实验设计方法
  4. CEGUI-----动画
  5. 没听说过这些,就不要说你懂并发了,three。
  6. 利用“队列”解决“窗口混乱”问题
  7. StaticFactoryMethod_Level2
  8. 这个宝藏工具,给你一种黑客般的感觉
  9. GPT2文本生成有问题?这里有些潜在解决思路
  10. 迁移学习与图神经网络“合力”模型:用DoT-GNN克服组重识别难题