ILSVRC2016中有一个Places Scene Classification和Scene Parsing项目的内容。

这次Places Scene Classification(Places2: A Large-Scale Database for
Scene Understanding)是第二次作为ILSVRC的比赛项目,而Scene Parsing Challenge(MIT
Scene Parsing Challenge
2016)是第一次纳入ILSVRC比赛,两者都是ILSVRC比较新的项目。因为考虑以往参与provided data
track人数远远大于external data track,今年这两个项目这次都只设provided data track。
.


一、场景分类数据库 Places2

官网:http://places2.csail.mit.edu/
github地址:
https://github.com/metalbubble/places365

数据介绍:Places2 contains more than 10 million images comprising 400+ unique scene categories. The dataset features 5000 to 30,000 training images per class, consistent with real-world frequencies of occurrence.

.
.


二、开源的Places365-CNNs

1、Places365 模型介绍

Places365 is the latest subset of Places2 Database. There are two versions of Places365: Places365-Standard and Places365-Challenge.

  • The train set of Places365-Standard has ~1.8 million images from 365 scene categories, where there are at most 5000 images per
    category. We have trained various baseline CNNs on the
    Places365-Standard and released them as below.
  • * the train set of Places365-Challenge* has extra 6.2 million images along with all the images of Places365-Standard (so
    totally ~8 million images), where there are at most 40,000 images per
    category. Places365-Challenge will be used for the Places2 Challenge
    2016 to be held in conjunction with the ILSVRC and COCO joint
    workshop at ECCV 2016.

2、Places365效能对比Places205


可以看到ResNet的TOP5已经85.08%,VGG表现出色啊!同期来看看places205:

两者的联合对比:

来看看最终的 VGG16-Places365结果:

另外参考:
1、为什么现在的CNN模型都是在GoogleNet、VGGNet或者AlexNet上调整的?
2、如何评价ILSVRC2016的比赛结果?

caffe︱Places365-CNNs For Scene Recognition相关推荐

  1. Places: A 10 million Image Database for Scene Recognition

    原文链接: http://places2.csail.mit.edu/PAMI_places.pdf 摘要 数百万项的数据集的兴起,让机器学习算法在物体和场景的识别等任务上可以接近人类语义分类的表现. ...

  2. 室内场景数据集 Indoor Scene Recognition

    分享一个轻量级的室内场景数据集:Indoor Scene Recognition 大小仅有2.4GB,包含67个类别,共有15620幅图像.不同类别的图像数量不同,每个类别至少有100幅图像.所有图像 ...

  3. 计算机视觉:场景识别(Scene Recognition)

    计算机视觉:场景识别(Scene Recognition) 场景识别 图像分类 特征提取 词袋模型 集成学习分类器 算法设计 结果分析 总结与展望 总结 展望 完整程序请移步至此链接下载 场景识别 在 ...

  4. 计算机视觉作业(三)Scene Recognition with Bag of Words

    一.实验原理 本次实验是基于词袋模型的图像分类技术,利用提取的局部区域的分布对图像进行识别.在图像分类中,词袋模型算法需要通过监督或非监督的学习来获得视觉词典.基于词袋模型的图像分类算法一般分为四步, ...

  5. Indoor Scene Recognition 室内场景识别数据集

    为下一步论文做准备. 有一个数据集过大,100多个G,从网上找到一个轻量级的室内场景识别数据集,MIT的,在这里留存一下.数据集下载链接: http://web.mit.edu/torralba/ww ...

  6. 【Paper】CNN-LSTM:Long-term Recurrent Convolutional Networks for Visual Recognition and Description

    论文期刊:CVPR 2015 (oral) 论文被引:3673 (04/24/20) 论文原文:点击此处 该论文是 CNN-LSTM 的开山鼻祖,主要用于生成图像描述.初稿发布于2014年,拿到了 C ...

  7. Material Recognition in the Wild with the Materials in Context Database论文笔记

    摘要: 在现实世界中,材料识别是一个有挑战性的任务.真实世界中的材料是有很丰富的表面纹理.几何形状.光照条件和杂波.这些因素使的这个问题难以处理.在这边论文,我们提出了一个新的.大规模的.在户外的材料 ...

  8. Knowledge Integration Networks for Action Recognition AAAI 2020

    AAAI 2020 码隆科技实验室+南京大学 1 摘要 在这项工作中,我们提出了用于视频动作识别的知识集成网络(KINet).KINet能够聚合有意义的上下文特征,这些特征对于识别动作非常重要,例如人 ...

  9. 论文笔记【A Comprehensive Study of Deep Video Action Recognition】

    论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...

最新文章

  1. 配置高可用的Hadoop平台
  2. 在Ubuntu中安装VMD
  3. WWW超文本源码浏览器
  4. MySQL深潜|剖析Performance Schema内存管理
  5. ADB 基础命令使用
  6. 365赚钱养猫小程序
  7. java applet html_将图像从Java Applet传递到HTML
  8. 在Session中存储和获取
  9. CCCC-GPLT L2-017. 人以群分 团体程序设计天梯赛
  10. 【转】 SQL 2005 try catch
  11. INTEL芯片组驱动下载地址
  12. 王道数据结构代码笔记
  13. linux虚拟机安装教程
  14. 类人猿X64安卓手游封包技术教程(主要易语言+个别C++)
  15. 区分度评估指标-KS
  16. centos 基础镜像中安装失败,提示:Error: Failed to download metadata for repo ‘AppStream‘: Cannot prepare internal
  17. Python茅台抢购脚本详细教程
  18. CAD梦想画图中的“绘图工具——椭圆弧”
  19. uniapp 上传图片到华为云obs
  20. mysql-8.0.21-winx64 安装

热门文章

  1. Android 数据库 在使用 update更新的时候,总是无法更新,还没有异常抛出!
  2. PHP+CKEditor 3配置详细说明(包括图片上传)
  3. 和我一起打造个简单搜索之ElasticSearch入门
  4. 轻松学DDD之二:如何高效消化知识
  5. Ubuntu离线安装VSCode(附带前期准备工作)
  6. sqoop和sqoop2区别
  7. Windows Server 2012正式版RDS系列⑻
  8. 关键字: datagridview 属性 说明
  9. 问题五:C++中const是干嘛用的
  10. 图片-标签、格式\内联框架\音视频播放——HTML