Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略

目录

WebVision数据集简介

1、WebVision数据集挑战

WebVision数据集下载

WebVision数据集使用方法


WebVision数据集简介

WebVision数据集主要有Google和Flickr两个数据源。主要是利用ImageNet1000个类的文本信息 从网站上爬数据,所以它的数据类别与}mageNet完全一样,为1000类别,由240万幅图片构成训练 数据。比}mageNet的两倍还多,分别由5万张图片构成验证集和测试集(均带有人工标注)。

1、WebVision数据集挑战

(1)、数据分布不平衡

WebVision数据集主要有两个挑战。 第一个挑战,数据分布非常不平衡。 如图横坐标代表1000个类别,纵坐标代表每个类别的图片数量。如图浅蓝色的平稳曲线是ImageNet的 数据分布,每一个类别大概有1200张图片。而深蓝色曲线为Web Vision数据分布,可以看出有的类别高达11000张,而最少的小于400张图片,这种极度不平衡的分布对训练模型影响非常大。

(2)、数据集含有大量错误或歧义的标签

第二个挑战,数据集含有大量错误或歧义的标签。 数据集中含有大量与类别标签不相关或歧义的图片,也就是所谓的噪声,这也是最主要的一个难点。比如Willet可以是一种鸟,但也可以是人名,也可以是建筑物的名字。

WebVision数据集下载

后期更新……

WebVision数据集使用方法

后期更新……

Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略相关推荐

  1. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

  2. Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...

  3. sklearn:sklearn.GridSearchCV函数的简介、使用方法之详细攻略

    sklearn:sklearn.GridSearchCVl函数的简介.使用方法之详细攻略 目录 sklearn.GridSearchCV函数的简介 1.参数说明 2.功能代码 sklearn.Grid ...

  4. sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略

    sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform.transform.inverse_transform简介.使用方法之详细攻略 ...

  5. ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介、使用方法之详细攻略

    ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介.使用方法之详细攻略 目录 sklearn.linear_mode中的LogisticRe ...

  6. sklearn:sklearn.feature_selection的SelectFromModel函数的简介、使用方法之详细攻略

    sklearn:sklearn.feature_selection的SelectFromModel函数的简介.使用方法之详细攻略 目录 SelectFromModel函数的简介 1.使用SelectF ...

  7. Python编程语言学习:包导入和模块搜索路径简介、使用方法之详细攻略

    Python编程语言学习:包导入和模块搜索路径简介.使用方法之详细攻略 目录 包导入和模块搜索路径简介 1.Pyhon搜索模块路径的机制 2.自定义配置搜索路径

  8. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  9. Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介、使用方法之详细攻略

    Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介.使用方法之详细攻略 目录 matplotlib.pyplot的plt.legend函数的简 ...

  10. BigData之Hive beeline:beeline的简介、使用方法之详细攻略

    BigData之Hive beeline:beeline的简介.使用方法之详细攻略 目录 beeline的简介 beeline的使用方法 1.命令行参数解释 2.beeline的输出格式 2.1.ta ...

最新文章

  1. 开源库BearSSL介绍及使用
  2. 信号与系统期末考试2020春季学期试题准备
  3. python列表元素替换的数据结构_Python基础学习数据结构(第2讲:列表;第2讲:列表创建、添加元素、插入元素、替换元素、删除元素、其他常用方法和列表派生),第二,主讲,追加,推导,式...
  4. 高中计算机网络安全教案,浙教版高中信息技术教案信息安全
  5. Maven学习-构建项目
  6. 多个线程访问统一对象的不同方法_不会多线程还想进BAT?精选19道多线程面试题,有答案边看边学...
  7. python打包和添加数据文件_python使用grpc,并打包成python模块
  8. flutter 自定义键盘_入门级机械键盘选购对比
  9. mcq 队列_人工智能| AI解决问题| 才能问题解答(MCQ)| 套装1
  10. JAVA Swing GUI设计 WindowBuilder Pro Container使用大全6——JLayeredPane使用
  11. 顶点计划家庭感情冲突问题讨论
  12. ObjectARX 2018 + AutoCAD2018 + VS2018 C# 创建第一个 Hello word程序
  13. 开篇一:基于ESP8266的电子墨水屏万年历
  14. 新站快速排名的优化技巧
  15. python 实体识别_英文实体识别的python实现
  16. 谁没有迟疑 彷徨的时候 --leo谈应届生求职 1
  17. 微信分享网络图片到朋友圈和收藏不显示图片的问题
  18. linux系统内存管理含义,Linux内存管理--基本概念及相关数据结构
  19. 毕业设计-基于微信小程序的实验室信息管理系统
  20. 软件工程与计算II-23-软件工程职业基础

热门文章

  1. idea javafx添加maven_IDEA通过Maven打包JavaFX工程(OpenJFX11)
  2. 关于路径搜索的算法, 可能用到
  3. 使用Nginx反向代理到go-fastdfs
  4. dubbo Trace 日志追踪
  5. 【洛谷 P4934】 礼物 (位运算+DP)
  6. 结合keepalived实现redis群集高可用故障自动切换
  7. 九种破解Xp登录密码方法
  8. 厉害了,如何通过双 key 来解决缓存并发问题?
  9. 干货 | 万字长文全面解析GraphQL,携程微服务背景下的前后端数据交互方案
  10. MySQL 优化原理(三)