机器学习样本数据集,训练正负样本
1、Caltech-101 数据库:该数据库在2003年被发布,包括101类目标图像和1类背景图像,共102类,彩色图像较多,有部分灰度图像。总共图像数为9145(除去背景后总数为8677),每类图像数大约在31~800之间,图像大小为300×200。此数据库的特点是:每个图像只含有一个目标,且目标大都处于图像中间位置,基本上占据整个图像区域,背景相对比较简单。
http://www.vision.caltech.edu/Image_Datasets/Caltech101/
2、Caltech-256 数据库:该数据库在2006年被发布,包括256类目标图像和1类背景图像,共257类。与Caltech101相比主要变化表现在,图像总数达到30608,且每类最少含有80幅图像。
http://www.vision.caltech.edu/Image_Datasets/Caltech256/
3、Pascal VOC 数据库:Pascal VOC Challenge(Pascal是Pattern Analysis, Statistical Modeling andComputational Learnin的缩写)是非常著名的视觉目标分类、检测及分割等任务比赛。从2005年到2012年,每年举行一届比赛并公布相应的数据库,该数据
库中每幅图像含有多个类的目标,从2007年开始,每年的数据库均含有20类目标,但具体的目标数不一样。
该数据库有三个显著的特点,每张图片可能含有多类目标且每类目标可能具有多个实例;目标的大小形状位置相差非常大;图像的背景比较复杂。这些特点给识别任务带来了非常大的困难。
http://host.robots.ox.ac.uk/pascal/VOC/
4、行人检测数据库:
http://pascal.inrialpes.fr/data/human/INRIAPerson.tar 大小970M
http://www.cis.upenn.edu/~jshi/ped_html/
机器学习样本数据集,训练正负样本相关推荐
- 目标检测中如何定义正负样本,和正负样本在学习过程中loss计算起的作用
如何定义正负样本,和正负样本在学习过程中loss计算起的作用 正负样本定义 分类和回归head如何学习和利用划分后的正负样本(loss如何计算) 正负样本在分类中loss计算的处理 正样本在bbox ...
- 分类模型-评估指标(2):ROC曲线、 AUC值(ROC曲线下的面积)【只能用于二分类模型的评价】【不受类别数量不平衡的影响;不受阈值取值的影响】【AUC的计算方式:统计所有正负样本对中的正序对】
评价二值分类器的指标很多,比如precision.recall.F1 score.P-R曲线等.但这些指标或多或少只能反映模型在某一方面的性能.相比而言,ROC曲线则有很多优点,经常作为评估二值分类器 ...
- 一文看懂推荐系统:召回07:双塔模型——正负样本的选择,召回的目的是区分感兴趣和不感兴趣的,精排是区分感兴趣和非常感兴趣的
一文看懂推荐系统:召回07:双塔模型--正负样本的选择,召回的目的是区分感兴趣和不感兴趣的,精排是区分感兴趣和非常感兴趣的 提示:最近系统性地学习推荐系统的课程.我们以小红书的场景为例,讲工业界的推荐 ...
- python样本不均衡_使用Python中的smote处理正负样本之间的不平衡,python,实现,失衡,问题...
机器学习中难免遇到正负样本不平衡问题,处理办法通常有梁总,一:过采样,增加正样本数据:二:欠采样,减少负样本数据,缺点是会丢失一些重要信息.smote属于过采样. 代码 # from imblearn ...
- Yolov3-v5正负样本匹配机制
本文来自公众号"AI大道理". 什么是正负样本? 正负样本是在训练过程中计算损失用的,而在预测过程和验证过程是没有这个概念的. 正样本并不是手动标注的GT. 正负样本都是针对于 ...
- 总结论文中正负样本的选择
对正负样本的选择 1.ssd:设置一个阈值(0.5),大于这个阈值的框为正样本,其它框作为负样本鉴定为背景.但是负样本还是远大于正样本,因此采用了难样本挖掘.难样本挖掘的具体操作是计算出所以负样本的损 ...
- yolo 负样本_目标检测正负样本区分策略和平衡策略总结(二)
0 简介 本文抛弃网络具体结构,仅仅从正负样本区分和正负样本平衡策略进行分析,大体可以分为正负样本定义.正负样本采样和平衡loss设计三个方面,主要是网络预测输出和loss核心设计即仅仅涉及网络的he ...
- 正负样本的定义、划分以及用于loss的计算的过程
文章目录 正负样本定义 难分.易分样本定义 正负样本不平衡-引自[Focal Loss](https://blog.csdn.net/qq_38253797/article/details/11629 ...
- Python机器学习日记4:监督学习算法的一些样本数据集(持续更新)
Python机器学习日记4:监督学习算法的一些样本数据集 一.书目与章节 二.forge数据集(二分类) 三.blobs数据集(三/多分类) 四.moons数据集 五.wave数据集(回归) 六.威斯 ...
最新文章
- 程序员接活利器,dataTable组件带你快速开发,摆脱CRUD
- 马化腾很受伤 后果很严重
- vue 路由相关操作
- 在Ubutun 14.04 Desktop LTS上部署Hadoop 2.7.1(伪分布式)
- 怎样写 OpenStack Neutron 的 Extension (四)
- 微信开放平台公众号第三方平台开发 教程一 平台介绍
- 找不到图片素材,看这里
- Java实现简单的计算器
- 从键盘输入n个整数,求它们的最小公倍数
- aix linux tcp连接数,修改windows、linux、aix等系统TCP/IP 参数
- 用于AB测试的减少方差方法总结和对比
- android动态壁纸2.2.1,动态壁纸选择器
- iPad半年使用心得
- Wikibon突破分析:数字技能差距预示IT服务支出的反弹
- 关于圆周卷积和fft求卷积的一些看法
- 鸟哥的私房菜——BASHShell
- (C++)strcmp函数的使用
- 什么是身份和访问管理(IAM)?
- 学IT需要具备什么条件?
- (附源码)基于SpringBoot的在线学生请假管理系统的设计与实现 毕业设计060935