文章首发于微信公众号《有三AI》

【AI-1000问】为什么深度学习图像分类的输入多是224*224

写在前边的通知

大家好,今天这又是一个新专栏了,名叫《有三AI 1000问》,顾名思义,就是以问题为主了!

那我们这个新专栏会有什么特色呢?主要从内容选择,目标受众,创作风格三个方面来讲述。

1、内容选择

因为我们有综述专栏,有各种垂直领域的非常详细的文章,所以从内容选择上,我们这一个专栏不会选择那些“大”问题,不会选择需要长篇分析的问题,也不会选择需要很强的实践操作的问题。

内容选择的标准是:

  • 技术相关

  • 足够聚焦

  • 容易被忽视

  • 普通但是不简单

  • 可以引申很多思考

不会入选的内容比如:“目标检测的最新进展”,“tensorflow的最新API”,“Mask RCNN文章阅读”等等之类的文章。

会入选的内容比如:“为什么图像分类输入大小多是224*224”,“为什么卷积神经网络要使用池化”。

2、目标受众

我认为未来机器学习技术/AI技术是每一个人都可以掌握,使用的技术,因此,我们这一个专栏不再只是面向从事相关工作的朋友,不会像其他专栏的文章那样对基础要求高。

目标受众包括:

  • AI领域从业技术人员

  • 其他计算机领域从业人员

  • AI技术业余爱好者

3、创作风格

这一个专栏以引导思考,普及知识为主,希望减轻阅读负担,因此不会像其他系列文章那样清晰地划分段落,也会适当地降低内容的深度。

创作风格是:

  • 不严格划分小节

  • 平衡内容深度和可阅读性

好了,具体内容就参考我们的第一期吧,希望你喜欢。

为什么深度学习图像分类里的图片的输入大小都是224*224呢?

做过图像分类项目或者看过文章的小伙伴们应该都知道,在论文中进行各类方法的比较时,要求使用同样的数据集。而为了公平的比较,网络的输入大小通常都是224*224的大小,那为什么呢?有同学思考过这个问题吗?

作者/编辑 言有三

我们都知道,一个图像分类模型,在图像中经历了下面的流程。

从输入image->卷积和池化->最后一层的feature map->全连接层->损失函数层softmax loss。

从输入到最后一个卷积特征feature map,就是进行信息抽象的过程,然后就经过全连接层/全局池化层的变换进行分类了,这个feature map的大小,可以是3*3,5*5,7*7等等。

解答1:在这些尺寸中,如果尺寸太小,那么信息就丢失太严重,如果尺寸太大,信息的抽象层次不够高,计算量也更大,所以7*7的大小是一个最好的平衡。

另一方面,图像从大分辨率降低到小分辨率,降低倍数通常是2的指数次方,所以图像的输入一定是7*2的指数次方。以ImageNet为代表的大多数分类数据集,图像的长宽在300分辨率左右。

解答2:所以要找一个7*2的指数次方,并且在300左右的,其中7*2的4次方=7*16=112,7*2的5次方等于7*32=224,7*2的6次方=448,与300最接近的就是224了。

这就是最重要的原因了,当然了对于实际的项目来说,有的不需要这么大的分辨率,比如手写数字识别MNIST就用32*32,有的要更大,比如细粒度分类。

思考

今天的问题就到这里了,不知道,你有没有留意过不同的输入大小对分类器性能的影响呢

转载文章请后台联系

侵权必究

感谢各位看官的耐心阅读,不足之处希望多多指教。后续内容将会不定期奉上,欢迎大家关注有三公众号 有三AI

【AI-1000问】为什么深度学习图像分类的输入多是224*224相关推荐

  1. 有三AI 1000问回归,备战秋招,更多,更快,更好,等你来战!

    文/编辑 | 言有三 最近遇到了很多朋友来询问<有三AI 1000问>在哪里?本来我做这个专栏的初衷只是想提醒大家要多主动思考,多注意细节,没想到击中了很多同学的痛点,不过之前已经停更了. ...

  2. 创业第一天,有三AI扔出了深度学习的150多篇文章和10多个专栏

    文/编辑 | 言有三 在这篇文章中,有三跟大家来聊一下有三AI和如何学习深度学习这件事儿. 1 概述 自我介绍 "有三AI"创始人网名言有三,本名龙鹏,本科就读于华中科技大学,硕士 ...

  3. 【AI初识境】深度学习模型评估,从图像分类到生成模型

    文章首发于微信公众号<有三AI> [AI初识境]深度学习模型评估,从图像分类到生成模型 这是<AI初识境>第10篇,这次我们说说深度学习模型常用的评价指标.所谓初识,就是对相关 ...

  4. 【AI初识境】深度学习中常用的损失函数有哪些?

    这是专栏<AI初识境>的第11篇文章.所谓初识,就是对相关技术有基本了解,掌握了基本的使用方法. 今天来说说深度学习中常见的损失函数(loss),覆盖分类,回归任务以及生成对抗网络,有了目 ...

  5. 伯禹公益AI《动手学深度学习PyTorch版》Task 04 学习笔记

    伯禹公益AI<动手学深度学习PyTorch版>Task 04 学习笔记 Task 04:机器翻译及相关技术:注意力机制与Seq2seq模型:Transformer 微信昵称:WarmIce ...

  6. 周志华、宋继强谈如何培养高端AI人才,以及深度学习的局限性和未来

    9 月 12 日,英特尔与南京大学宣布成立英特尔-南京大学人工智能联合研究中心,双方将在人工智能技术创新.人才培养以及生态建设方面进一步加强合作.英特尔中国研究院院长宋继强.南京大学人工智能学院院长周 ...

  7. AI安全初探——利用深度学习检测DNS隐蔽通道

    AI安全初探--利用深度学习检测DNS隐蔽通道 目录 AI安全初探--利用深度学习检测DNS隐蔽通道 1.DNS 隐蔽通道简介 2. 算法前的准备工作--数据采集 3. 利用深度学习进行DNS隐蔽通道 ...

  8. 【视频课】一课彻底掌握深度学习图像分类各种问题,学习CV你值得拥有

    课程介绍 对于刚接触深度学习计算机视觉的初学者来说,图像分类问题是最常见的问题,如何最好图像分类任务,关系到大家能否正确顺利地入门.读了许多论文,可能仍然不懂代码如何实现.跑了代码,仍旧不懂如何运用图 ...

  9. 【AI初识境】深度学习模型中的Normalization,你懂了多少?

    文章首发于微信公众号<有三AI> [AI初识境]深度学习模型中的Normalization,你懂了多少? 这是<AI初识境>第6篇,这次我们说说Normalization.所谓 ...

最新文章

  1. 第一个MapReduce程序
  2. VMware三种网络模式根本区别
  3. openssl简介-指令s_client
  4. 佳能发售曝光对应的「IXY DIGITAL 3000 IS」
  5. python中遇到的问题及解决方法_自己编程中遇到的Python错误和解决方法汇总整理...
  6. 每周荐书:分布式、深度学习算法、iOS(评论送书)
  7. Atitit 性能提升总结 流水线模式 FutureTask ForkJoinTask 1.1. 流水线工作方式pipeline 1 1.2. FutureTask模式使用异步 流水线 还有多
  8. linux中硬链接为什么不能跨分区
  9. 性能优化,进无止境---CPU篇
  10. OPenCV4-颜色识别(二)三原色识别
  11. commons-lang3官方教程
  12. 平面设计证书怎么考,平面设计证书有用吗:夏雨老师
  13. 抖音自媒体上热门的诀窍,高效蹭实时热点的4个技巧
  14. 第一个被赋予公明身份的机器人_史上首次 沙特授予“女性”机器人索菲娅公民身份...
  15. 学习post抓包最好用的抓包工具
  16. IDEA中JAVA代码调试技巧
  17. RISC-V SiFive U54内核——中断和异常详解
  18. Springboot -Shiro整合JWT(注解形式)
  19. (二)计算机组成原理——计算机的基本组成
  20. 浅析TVS管和ESD有什么区别?

热门文章

  1. 【KVM系列文章】目录
  2. java.lang.ClassCastException: [B cannot be cast to java.lang.String
  3. 10--MySQL数据查询应用(实战)(一)
  4. 【小练习04】HTML+CSS--医药健康小页面
  5. Springbooot集成Shiro简单使用
  6. (Spring)静态/动态代理模式(AOP底层)
  7. (Java)关于泛型
  8. sevlet实现下载文件功能
  9. 排序算法 | 快速排序,算法的图解、实现、复杂度和稳定性分析与优化
  10. Oracle 杀死session的方法