1、Caltech-101 数据库:该数据库在2003年被发布,包括101类目标图像和1类背景图像,共102类,彩色图像较多,有部分灰度图像。总共图像数为9145(除去背景后总数为8677),每类图像数大约在31~800之间,图像大小为300×200。此数据库的特点是:每个图像只含有一个目标,且目标大都处于图像中间位置,基本上占据整个图像区域,背景相对比较简单。

http://www.vision.caltech.edu/Image_Datasets/Caltech101/

2、Caltech-256 数据库:该数据库在2006年被发布,包括256类目标图像和1类背景图像,共257类。与Caltech101相比主要变化表现在,图像总数达到30608,且每类最少含有80幅图像。

http://www.vision.caltech.edu/Image_Datasets/Caltech256/

3、Pascal VOC 数据库:Pascal VOC Challenge(Pascal是Pattern Analysis, Statistical Modeling andComputational Learnin的缩写)是非常著名的视觉目标分类、检测及分割等任务比赛。从2005年到2012年,每年举行一届比赛并公布相应的数据库,该数据
库中每幅图像含有多个类的目标,从2007年开始,每年的数据库均含有20类目标,但具体的目标数不一样。
          该数据库有三个显著的特点,每张图片可能含有多类目标且每类目标可能具有多个实例;目标的大小形状位置相差非常大;图像的背景比较复杂。这些特点给识别任务带来了非常大的困难。

http://host.robots.ox.ac.uk/pascal/VOC/

4、行人检测数据库:

http://pascal.inrialpes.fr/data/human/INRIAPerson.tar                   大小970M

http://www.cis.upenn.edu/~jshi/ped_html/

机器学习样本数据集,训练正负样本相关推荐

  1. 目标检测中如何定义正负样本,和正负样本在学习过程中loss计算起的作用

    如何定义正负样本,和正负样本在学习过程中loss计算起的作用 正负样本定义 分类和回归head如何学习和利用划分后的正负样本(loss如何计算) 正负样本在分类中loss计算的处理 正样本在bbox ...

  2. 分类模型-评估指标(2):ROC曲线、 AUC值(ROC曲线下的面积)【只能用于二分类模型的评价】【不受类别数量不平衡的影响;不受阈值取值的影响】【AUC的计算方式:统计所有正负样本对中的正序对】

    评价二值分类器的指标很多,比如precision.recall.F1 score.P-R曲线等.但这些指标或多或少只能反映模型在某一方面的性能.相比而言,ROC曲线则有很多优点,经常作为评估二值分类器 ...

  3. 一文看懂推荐系统:召回07:双塔模型——正负样本的选择,召回的目的是区分感兴趣和不感兴趣的,精排是区分感兴趣和非常感兴趣的

    一文看懂推荐系统:召回07:双塔模型--正负样本的选择,召回的目的是区分感兴趣和不感兴趣的,精排是区分感兴趣和非常感兴趣的 提示:最近系统性地学习推荐系统的课程.我们以小红书的场景为例,讲工业界的推荐 ...

  4. python样本不均衡_使用Python中的smote处理正负样本之间的不平衡,python,实现,失衡,问题...

    机器学习中难免遇到正负样本不平衡问题,处理办法通常有梁总,一:过采样,增加正样本数据:二:欠采样,减少负样本数据,缺点是会丢失一些重要信息.smote属于过采样. 代码 # from imblearn ...

  5. Yolov3-v5正负样本匹配机制

    本文来自公众号"AI大道理". ​ 什么是正负样本? 正负样本是在训练过程中计算损失用的,而在预测过程和验证过程是没有这个概念的. 正样本并不是手动标注的GT. 正负样本都是针对于 ...

  6. 总结论文中正负样本的选择

    对正负样本的选择 1.ssd:设置一个阈值(0.5),大于这个阈值的框为正样本,其它框作为负样本鉴定为背景.但是负样本还是远大于正样本,因此采用了难样本挖掘.难样本挖掘的具体操作是计算出所以负样本的损 ...

  7. yolo 负样本_目标检测正负样本区分策略和平衡策略总结(二)

    0 简介 本文抛弃网络具体结构,仅仅从正负样本区分和正负样本平衡策略进行分析,大体可以分为正负样本定义.正负样本采样和平衡loss设计三个方面,主要是网络预测输出和loss核心设计即仅仅涉及网络的he ...

  8. 正负样本的定义、划分以及用于loss的计算的过程

    文章目录 正负样本定义 难分.易分样本定义 正负样本不平衡-引自[Focal Loss](https://blog.csdn.net/qq_38253797/article/details/11629 ...

  9. Python机器学习日记4:监督学习算法的一些样本数据集(持续更新)

    Python机器学习日记4:监督学习算法的一些样本数据集 一.书目与章节 二.forge数据集(二分类) 三.blobs数据集(三/多分类) 四.moons数据集 五.wave数据集(回归) 六.威斯 ...

最新文章

  1. 程序员接活利器,dataTable组件带你快速开发,摆脱CRUD
  2. 马化腾很受伤 后果很严重
  3. vue 路由相关操作
  4. 在Ubutun 14.04 Desktop LTS上部署Hadoop 2.7.1(伪分布式)
  5. 怎样写 OpenStack Neutron 的 Extension (四)
  6. 微信开放平台公众号第三方平台开发 教程一 平台介绍
  7. 找不到图片素材,看这里
  8. Java实现简单的计算器
  9. 从键盘输入n个整数,求它们的最小公倍数
  10. aix linux tcp连接数,修改windows、linux、aix等系统TCP/IP 参数
  11. 用于AB测试的减少方差方法总结和对比
  12. android动态壁纸2.2.1,动态壁纸选择器
  13. iPad半年使用心得
  14. Wikibon突破分析:数字技能差距预示IT服务支出的反弹
  15. 关于圆周卷积和fft求卷积的一些看法
  16. 鸟哥的私房菜——BASHShell
  17. (C++)strcmp函数的使用
  18. 什么是身份和访问管理(IAM)?
  19. 学IT需要具备什么条件?
  20. (附源码)基于SpringBoot的在线学生请假管理系统的设计与实现 毕业设计060935

热门文章

  1. “算法即芯片”有点扯,互联网公司为何热衷造概念?
  2. Python 鸭子类型的理解
  3. anki怎么设置学习计划_anki如何设置选项(学习任务)?
  4. 齐岳研发可聚合性基团的小分子稀土配合物Eu(TTA)2phen
  5. linux文件系统实现原理简述【转】
  6. 了解公司企业:Primetics
  7. 逍遥模拟器怎样连接android,逍遥安卓模拟器
  8. 浪潮飞龙系列国产服务器
  9. MediaPlayer读取手机内存文件夹权限问题
  10. 分支限界法(算法分析与设计)