- 计算机视觉 -为什么说 Dropout 可以解决过拟合?(1)取平均的作用: 先回到标准的模型即没有 dropout,我们用相同的训练数据去训练 5 个不同的神经网络,一般会得到 5 个不同的结果,此时我们可以采用 “5 个结果取均值” 或者 “多数取胜的投票策略” 去决定最终结果。例如 3 个网络判断结果为数字 9, 那么很有可能真正的结果就是数字 9,其它两个网络给出了错误结果。这种 “综合起来取平均” 的策略通常可以有效防止过拟合问题。因为不同的网络可能产生不同的过拟合,取平均则有可能让一些 “相反的” 拟合互相抵消。dropout 掉不同的隐藏神经元就类似在训练不同的网络,随机删掉一半隐藏神经元导致网络结构已经不同,整个 dropout 过程就相当于对很多个不同的神经网络取平均。而不同的网络产生不同的过拟合,一些互为 “反向” 的拟合相互抵消就可以达到整体上减少过拟合。(2)减少神经元之间复杂的共适应关系: 因为 dropout 程序导致两个神经元不一定每次都在一个 dropout 网络中出现。这样权值的更新不再依赖于有固定关系的隐含节点的共同作用,阻止了某些特征仅仅在其它特定特征下才有效果的情况 。迫使网络去学习更加鲁棒的特征 ,这些特征在其它的神经元的随机子集中也存在。换句话说假如我们的神经网络是在做出某种预测,它不应该对一些特定的线索片段太过敏感,即使丢失特定的线索,它也应该可以从众多其它线索中学习一些共同的特征。从这个角度看 dropout 就有点像 L1,L2 正则,减少权重使得网络对丢失特定神经元连接的鲁棒性提高。(3)Dropout 类似于性别在生物进化中的角色:物种为了生存往往会倾向于适应这种环境,环境突变则会导致物种难以做出及时反应,性别的出现可以繁衍出适应新环境的变种,有效的阻止过拟合,即避免环境改变时物种可能面临的灭绝关于 dropout 需要知道什么?直观认识:Dropout 随机删除神经元后,网络变得更小,训练阶段也会提速;事实证明,dropout 已经被正式地作为一种正则化的替代形式;有了 dropout,网络不会为任何一个特征加上很高的权重(因为那个特征的输入神经元有可能被随机删除),最终 dropout 产生了收缩权重平方范数的效果;Dropout 的功能类似于 L2 正则化,但 Dropout 更适用于不同的输入范围;如果你担心某些层比其它层更容易过拟合,可以把这些层的 keep-prob 值设置的比其它层更低;Dropout 主要用在计算机视觉领域,因为这个领域我们通常没有足够的数据,容易过拟合。但在其它领域用的比较少;Dropout 的一大缺点就是代价函数不再被明确定义,所以在训练过程中,代价函数的值并不是单调递减的;使用时,先关闭 Dropout,设置 keep-prob 为 1,使代价函数的值单调递减,然后再打开 Dropout;Dropout 与 L1 和 L2 正则化有什么区别?L1 和 L2 正则化通过在损失函数上增加参数的惩罚项,通过对参数大小的约束,起到类似降维的作用(若高阶项参数接近 0,相当于降阶)。进而简化模型,提高模型泛化力,避免过拟合。L1 和 L2 正则化修改代价函数,Dropout 修改神经网络本身。评价指标有哪些?机器学习中评价指标:Accuracy(准确率)、 Precision(查准率或者精准率)、Recall(查全率或者召回率)。目标检测的指标:识别精度,识别速度,定位精度。a、目标检测中衡量识别精度的指标是 mAP(mean average precision)。多个类别物体检测中,每一个类别都可以根据 recall 和 precision 绘制一条曲线,AP 就是该曲线下的面积,mAP 是多个类别 AP 的平均值。b、  目标检测评价体系中衡量定位精度的指标是 IoU,IoU 就是算法预测的目标窗口和真实的目标窗口的交叠(两个窗口面积上的交集和并集比值)非极大值抑制算法步骤非极大值抑制算法(Non-maximum suppression,NMS)在目标检测中经常用到。我们的检测算法可能对同一目标产生多次检测的结果,非极大值抑制算法可以保证每个目标只检测一次,找到检测效果最好的框。(1)去除所有预测框置信度于某个阈值的框,这里的阈值选取为 0.5。(2)在剩下的 1、2、4、5、6 号框中选取置信度最大的,即图中 5 号框,比较除 5 号框以外所有框于 5 号框的交并比,若交并比大于某个阈值(人工给定的值),则抑制这些不是局部极大值预测框输出。(3)再从剩下的框中选取置信度最大的,重复上面的步骤,直至没有框被舍去时结束。(4)最后 2 号和 5 号框被保留,其他框被抑制。若检测物体是多个类别的时候,一般情况是对每个类别分别做一次非极大值抑制算法。斜着的矩形框如何求 iou?两个多边形的框如何求 iou?首先要求解两个多边形的面积,方法见该链接关键在于如何求出交集的面积思路一:蒙特卡洛 + 采样,近似求解交集的面积,但是中间涉及判断点在不在多边形内,判断点是否在多边形内思路二:适合于两个凸多边形(非凸没想到好的思路),凸多边形可以看做是半平面的交集,因此两个凸多边形的交集,可以看作是(m+n)个半平面的交集(假设两个凸多边形分别有 m 个顶点和 n 个顶点),求出来半平面的交集(仍旧是一个凸多边形)之后,求解该多边形的面积即可。求解半平面交集RPN 的平移不变形如何解决?在计算机视觉中的一个挑战就是平移不变性:比如人脸识别任务中,小的人脸 (24*24 的分辨率) 和大的人脸 (1080*720) 如何在同一个训练好权值的网络中都能正确识别。若是平移了图像中的目标,则建议框也应该平移,也应该能用同样的函数预测建议框。传统有两种主流的解决方式:第一、对图像或 feature map 层进行尺度 \ 宽高的采样;第二、对滤波器进行尺度 \ 宽高的采样 (或可以认为是滑动窗口).但 Faster R-CNN 解决该问题的具体实现是:通过卷积核中心 (用来生成推荐窗口的 Anchor) 进行尺度、宽高比的采样,使用 3 种尺度和 3 种比例来产生 9 种 anchor。RPN 生成候选框样本不均衡有什么问题?

  1. 为了训练速度和训练精度的平衡,原始图像进入训练之前需要先进行 resize,使图像的短边为 600(或者长边为 1000);
  2. 在训练过程产生的 anchor 中,忽视掉所有的超过图像边界的 anchor:如在 1000*600 的图像中,大概会有 20000(60*40*9)个 anchor,去除掉超过边界的 anchor 之后,还剩 6000 个。论文中提到:若是不去除这些 anchor 的话,它们会带来大量的、难以纠正的错误,并且导致训练 loss 难以收敛。而在测试过程中,对于超出边界的 anchor 并不是删除,而是修剪掉其超过边界的部分。
  3. RPN 得到的大量 proposal 可能会相互重叠,冗余度较高,论文根据这些 proposal 的 cls 得分对其区域采用非极大值抑制(NMS)去除冗余 proposal,经过 NMS 后每张图还剩下大概 2000 个 proposal。经过实验,NMS 并不会降低检测的准确度,但是大量减少了无关的 proposal。
  • 对每个标定的 ground true box 区域,与其重叠比例最大的 anchor 记为正样本 (保证每个 ground true 至少对应一个正样本 anchor)
  • 对 1 中剩余的 anchor,如果其与某个标定区域重叠比例 (IoU) 大于 0.7,记为正样本(每个 ground true box 可能会对应多个正样本 anchor。但每个正样本 anchor 只可能对应一个 grand true box);如果其与任意一个标定的重叠比例都小于 0.3,记为负样本。
  • 对 1、2 剩余的 anchor,弃去不用。
  • 跨越图像边界的 anchor 弃去不用。

池化主要有哪几种?(1)一般池化(General Pooling)其中最常见的池化操作有平均池化、最大池化:平均池化(average pooling):计算图像区域的平均值作为该区域池化后的值。最大池化(max pooling):选图像区域的最大值作为该区域池化后的值。(2)重叠池化(OverlappingPooling)重叠池化就是,相邻池化窗口之间有重叠区域,此时一般 sizeX > stride。(3)空金字塔池化(Spatial Pyramid Pooling)空间金字塔池化的思想源自 Spatial Pyramid Model,它将一个 pooling 变成了多个 scale 的 pooling。用不同大小池化窗口作用于上层的卷积特征。也就是说 spatital pyramid pooling layer 就是把前一卷积层的 feature maps 的每一个图片上进行了 3 个卷积操作,并把结果输出给全连接层。其中每一个 pool 操作可以看成是一个空间金字塔的一层。(具体的细节可以看下面的参考链接,讲的比较详细)这样做的好处是,空间金字塔池化可以把任意尺度的图像的卷积特征转化成相同维度,这不仅可以让 CNN 处理任意尺度的图像,还能避免 cropping 和 warping 操作,导致一些信息的丢失,具有非常重要的意义池化层主要的作用(1)首要作用,下采样(downsamping)(2)降维、去除冗余信息、对特征进行压缩、简化网络复杂度、减小计算量、减小内存消耗等等。各种说辞吧,总的理解就是减少参数量。(3)实现非线性(这个可以想一下,relu 函数,是不是有点类似的感觉?)。(4)可以扩大感知野。(5)可以实现不变性,其中不变形性包括,平移不变性、旋转不变性和尺度不变性。A:特征不变性,也就是我们在图像处理中经常提到的特征的尺度不变性,池化操作就是图像的 resize,平时一张狗的图像被缩小了一倍我们还能认出这是一张狗的照片,这说明这张图像中仍保留着狗最重要的特征,我们一看就能判断图像中画的是一只狗,图像压缩时去掉的信息只是一些无关紧要的信息,而留下的信息则是具有尺度不变性的特征,是最能表达图像的特征。B:特征降维,我们知道一幅图像含有的信息是很大的,特征也很多,但是有些信息对于我们做图像任务时没有太多用途或者有重复,我们可以把这类冗余信息去除,把最重要的特征抽取出来,这也是池化操作的一大作用。注:以上内容不代表准确概念,请自行参考。

计算机视觉常见面试题型介绍及解答

第一期 | 第二期 | 第三期 | 第四期 | 第五期 | 第六期

阿里算法岗位最新编程题介绍及解析

第一期 | 第二期 | 第三期 | 第四期 | 第五期 | 第六期 | 第七期

腾讯算法工程师笔试真题介绍及解析汇总合集

第一期 | 第二期 | 第三期 | 第四期 | 第五期 |

js 计算任意凸多边形内最大矩形_题库 | 计算机视觉常见面试题型介绍及解答 第 7 期...相关推荐

  1. python数据结构与算法分析 第2版_题库 | 百度数据结构 / 算法面试题型介绍及解析 第 2 期...

    题目1:分解成质因数 (如 435234=251*17*17*3*2) void prim(int m, int n){ if(m>n){ while(m%n != 0) n++; m /= n ...

  2. python资源管理器 计算机项目下的_高级语言程序设计(Python)_中国大学MOOC(慕课)_题库及答案...

    高级语言程序设计(Python)_中国大学MOOC(慕课)_题库及答案 来源:未知 编辑:admin 时间:2020-06-30 更多相关问题 以下选项中能正确调用fun函数的语句是charfun(c ...

  3. 电大计算机网考选择题库,电大本科计算机应用基础_题库_计算机网考_真题选择题详细分析...

    电大本科计算机应用基础_题库_计算机网考_真题选择题详细分析 (47页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 11.90 积分 全国网络统考< ...

  4. python题库和答案_Python数据分析与数据可视化_题库免费答案2020

    Python数据分析与数据可视化_题库免费答案2020 更多相关问题 撰写纪要时,发现与会者发言质量不高时,可以进行拔高.提炼,一定要做好后期加工.() 在发布的对象中,凡是属于法规性文件,标题和正文 ...

  5. vue+d3.js计算任意多边形面积

    效果图 代码 <!DOCTYPE html> <html lang="en"> <head><meta charset="UTF ...

  6. 奥鹏C语言程序设计考试,C语言程序设计_题库_201903_A 更新20春北理工复习题

    [试题分类]:C语言程序设计下列关于C语言中main函数位置的叙述中,正确的是 ' q% c* Y# b! Q# q5 O# N9 {A. 必须在程序的最后 0 e$ I* r% c( v. ?# ] ...

  7. 计算机内存与内置类型,笔记本内存种类有哪些 笔记本常见内存类型介绍

    此前经常有电脑小白咨询我"128GB内存够不够"之类的问题,很明显这是将内存和硬盘搞混了.如果你也分不清内存和硬盘,那么很有必要看下去.本文主要介绍目前笔记本中常见的内存类型,并且 ...

  8. vba调用mysql随机出题软件_题库需要随机进行出题

    Function 随机试题()    '产生随机数代码,40个随机数字从1-100中取 '1.声明变量 Dim dx As Integer            '随机单选题数值 Dim dxjh A ...

  9. oracle分库分表原理_题库分库分表架构方案

    方案 项目背景 在现在题库架构下,针对新购买的1300W多道数据进行整合,不影响现有功能.由于数据量偏多,需要进行数据的切分 目标场景 兼容旧的功能 对1300多W数据进行分库分表 需要对旧的数据进行 ...

最新文章

  1. “电梯演讲”最精炼、贴切的语言
  2. VCS user guide读书笔记启发篇
  3. vb调用matlab工具箱,Matlab与VB集成 - 关于VB的经验之谈 - VB爱好者乐园(VBGood) - 关于VB的经验,电子教程,代码,控件,论坛,博客,微博等....
  4. 算法优化:动态规划加速,货物运输问题,四边形不等式, 从O(n^2)到O(n^3)
  5. Java与.net的区别delegate和event
  6. Python开发过程中17个坑
  7. Hadoop 服务器配置的副本数量 管不了客户端
  8. linux下ASM配置
  9. 太湖2018年渔业产值达7.3亿元 今年大闸蟹产量将降低
  10. excel减法函数_会计小白的EXCEL学习笔记
  11. 基于OpenCV的图像透视变换详解(从理论到实现再到实践)
  12. MEM/MBA 写作-论证有效性分析(09)逻辑缺陷-误用百分数滑坡谬误
  13. 使用Jmeter批量测试视频链接可用性
  14. linux重命名文件或文件夹(mv命令 rename命令)
  15. 破解西胍无水印视频,实现完美下载
  16. 第二阶段--团队冲刺--第五天
  17. 超有用的前端配色网站
  18. (跟新至2019)历年研究生数学建模题目与优秀论文
  19. make错误 redis6_redis安装make失败,make[1]: *** [adlist.o] Error 127....
  20. 左手坐标系和右手坐标系(以及右手定则左手定则)

热门文章

  1. 【CSWS2014 Summer School】互联网广告中的匹配和排序算法-蒋龙(上)
  2. python面向对象-4类的继承与方法的重载
  3. All Things OpenTSDB
  4. mongodb-$type、limit、skip、sort方法、索引、聚合
  5. 设计模式(2)策略模式 (模式讲解+应用)
  6. NOR flash and NAND flash
  7. 要开始另一个linux操作系统的尝试了,说说我以前的ubuntu吧
  8. python 字典 get(),items(),iteritems()方法
  9. 这是一个无效的源路径
  10. ASP.NET Web Api 实现数据的分页