深度学习（计算机视觉）面试问题：

深度学习（计算机视觉）面试问题：
转载原文：https://blog.csdn.net/comway_Li/article/details/82532573
1.1*1卷积的作用：
答：1.实现跨通道的交互和信息整合2.进行卷积核通道数的降维和升维3.实现多个feature map的线性组合，实现通道个数的变换4.对特征图进行一个比例缩放

2.CNN池化层有什么作用？
答：1、减小图像尺寸，数据降维。2、缓解过拟合。3、保持一定程度的旋转和平移不变性，maxpooling能保证卷积神经网络在一定范围内平移特征能得到同样的激励，具有平移不变性。

3.空洞卷积的作用是什么？
答:空洞卷积也叫扩张卷积，在保持参数个数不变的情况下增加了卷积核的感受野，同时它可以保证输出的特征映射（feature map）的大小保持不变。一个扩张率为2的3x3卷积核，感受野与5x5的卷积核相同，但参数个数量仅为9个。

4.深度学习中常用的损失函数？
答：交叉熵损失，平方差损失，绝对值损失，Hinge Loss。

5、 Sigmoid激活函数为什么会出现梯度消失？Sigmoid函数导数的最大值出现在哪个值？
答：为什么会出现梯度消失，从两方面来看，首先先看本身函数，若输入值X过大，sigmoid函数导数为零，第二方面：sigmoid函数求导，导数最大是等于1/4，小于1，经过深的网络传递就会出现梯度消失的问题。
在x=0时导数最大

6.评价指标有哪些？
答、机器学习中评价指标： Accuracy（准确率）、 Precision（查准率或者精准率）、Recall（查全率或者召回率）。
目标检测的指标：识别精度，识别速度，定位精度。
a、目标检测中衡量识别精度的指标是mAP（mean average precision）。多个类别物体检测中，每一个类别都可以根据recall和precision绘制一条曲线，AP就是该曲线下的面积，mAP是多个类别AP的平均值。
b、目标检测评价体系中衡量定位精度的指标是IoU,IoU就是算法预测的目标窗口和真实的目标窗口的交叠（两个窗口面积上的交集和并集比值）

7.深度学习训练时网络不收敛的原因有哪些？如何解决？
答：不收敛一般都是数据不干净，学习率设置不合理，网络等问题

8.如何应对图像光照变化大？
答：1、直方图均衡化
2、对比度拉伸，或者调节
3、若受光源影响，使得图片整体色彩往一方面移动，用白平衡算法进行修正，使其发黄、发蓝、发红的照片更加趋于自然光下的图像
4、若是过爆或者过暗，可是设计阈值函数，不用全局阈值，对特定区域进行特定阈值分割。
5、若是太暗，可以采用对数变化，对数图像增强是图像增强的一种常见方法，其公式为： S = c log(r+1)，对数使亮度比较低的像素转换成亮度比较高的，而亮度较高的像素则几乎没有变化，这样就使图片整体变亮。
6、采用拉普拉斯算子增强，
filter2D(src,dst)

9、常用的分割方法有哪些？
答：1、基于阈值的分割方法：比较常用的阂值法有大律法、最小误差法
2、基于边缘的分割方法：常见的微分算子包括Robert算子、Prewitt算子、Sobel算子、Laplaeian算子、Canny算子等
3、基于区域的分割方法：主要包括种子区域生长法、区域分裂合并法和分水岭法等几种类型。
4、基于图论的分割方法：Graph Cut方法
5、深度学习：语义分割等

10.深度学习为什么要这么深？

11.如何解决数据不平衡问题：
答：1、利用重采样中的下采样和上采样，对小数据集类别分别采用上采样，通过复制来增加数据，不过这种情况容易出现过拟合，建议用数据扩增的方法，对原有数据集进行翻转，旋转，平移，尺度拉伸，对比度，亮度，彩色变化来增加数据。对大数据类别剔除一些样本量。
2.组合不同的重采样数据集：假设建立十个模型，选取小数据类1000个数据样本，然后将大数据类别10000个数据样本分为十份，每份为1000个，并训练十个不同的模型。
3、更改分类器评价指标：在传统的分类方法中，准确率是常用的指标。然而在不平衡数据分类中，准确率不再是恰当的指标，采用精准率即查准率P：真正例除以真正例与假正例之和。召回率即查全率F：真正例除以真正例与假反例之和。

12.对于训练集与验证集测试集分布不同的处理办法
答：1、若训练集与验证集来自不同分布，比如一个网络爬虫获取的高清图像，一个是手机不清晰图像，人工合成图像2、两种来源的数据，一个来源数据大比如20万张，一个来源数据小，比如五千张。小数据集是我们优化目标。一种情况是将两组数据合并在一起，然后随机分配到训练验证测试集中，好处是，三个数据集来自同一分布。缺点：瞄准目标都是大数据那一类的数据，而不是我们的目标小数据集。另外一种情况是训练集全部用大数据集，开发与测试都是小数据集，有点：瞄准目标，坏处是不同分布。

13.如何改善训练模型的效果呢？
答：1、通过提升数据，获取良好的数据。对数据预处理；零均值1方差化，数据扩充或者增强
2.诊断网络是否过拟合
3.通过学习率、激活函数的选择，改善网络全连接层个数，优化算法，随机梯度，RMPSprop,动量，adam,使用bachnormlization.
4.权值初始化Xavier初始化，保持输入与输出端方差一致，避免了所有输出都趋向于0；

14.如何解决梯度爆炸与消失
答：1、预训练加微调梯度剪、权重正则
2.使用不同的激活函数3、使用bachnorm4、使用残差结构5、使用LSTM网络

15.为什么要使用许多小卷积核（如3x3）而不是几个大卷积核？

16.为什么在图像分割中CNNs通常具有编码器-解码器结构？
编码器CNN基本上可以被认为是特征提取网络，而解码器使用该信息通过“解码”特征并放大到原始图像大小来预测图像分割区域。

17.为什么我们对图像使用卷积而不仅仅是FC层？

18.什么是数据正则化\归一化（normalization）？为什么我们需要它？
答：数据归一化是非常重要的预处理步骤，用于重新缩放输入的数值以适应特定的范围，从而确保在反向传播期间更好地收敛。一般来说采取的方法是减去每个数据点的平均值并除以其标准差。如果不这样做，那么一些特征（那些具有高幅值）将在cost函数中得到更大的加权，（如果较高幅值的特征改变1%，则改变相当大，但是对于较小的特征，改变相当小）。

19.解释降维（dimensionality reduction），降维在哪里使用，降维的好处是什么？
降维是通过获得一组基本上是重要特征的主变量来减少所考虑的特征变量的过程。特征的重要性取决于特征变量对数据信息表示的贡献程度。好处：1减少所需的存储空间2.加快计算速度3.将数据的维数降低到2D或3D可以允许我们绘制和可视化它，给我们提供直观感受。4.太多的特征或太复杂的模型可能导致过拟合。

深度学习（计算机视觉）面试问题：相关推荐

AI：一个20年程序猿的学习资料大全—人工智能之AI/机器学习/深度学习/计算机视觉/Matlab大赛——只有你不想要的，没有你找不到的
AI:一个20年程序猿的学习资料大全-人工智能之AI/机器学习/深度学习/计算机视觉/Matlab大赛--只有你不想要的,没有你找不到的目录 (有偿提供,替朋友转载,扫描下方二维码提问,或者向博主扫 ...
深度学习计算机视觉常见的29道面试题及解析
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货作者丨我要鼓励娜扎@知乎来源丨https://zhuanlan.zhihu.com/p/89 ...
【百家稷学】深度学习计算机视觉生产实习（山西农业大学暑期实训）
继续咱们百家稷学专题,本次是有三AI在山西农业大学开设的为期10天的正式暑期专业课程.百家稷学专题的目标,是走进100所高校和企业进行学习与分享. 本次主题本次实训是在山西农业大学进行,主题是< ...
虎牙AI基础技术部招聘深度学习/计算机视觉实习生
01 公司简介虎牙公司是一家以游戏直播为核心业务.致力于打造全球领先直播平台的技术驱动型内容公司,旗下产品包括知名游戏直播平台虎牙直播.风靡东南亚和南美的游戏直播平台NimoTV等,产品覆盖PC.W ...
ktt算法约化_答：那些深度学习《面试》你可能需要知道的
本文是问题"那些深度学习<面试>你可能需要知道的"的回答,答案均以英文版Deep Learning页标标记. 1.列举常见的一些范数及其应用场景,如L0,L1,L2,L ...
深度学习机器学习面试问题准备（必会）
深度学习机器学习面试问题准备(必会) 第一部分:深度学习 1.神经网络基础问题 (1)Backpropagation(要能推倒) 后向传播是在求解损失函数L对参数w求导时候用到的方法,目的是通过链式 ...
[面试笔试整理1]：深度学习机器学习面试问题准备（必会）
此系列三篇文章的原文链接面试笔试整理1:深度学习机器学习面试问题准备(必会) 1.神经网络基础问题 (1)Backpropagation(要能推倒) 后向传播是在求解损失函数L对参数w求导时候用到的 ...
深度学习/计算机视觉学习资料
深度学习/计算机视觉相关的博文/在线图书等的汇总,主要是个人比较感兴趣的环境理解/视频理解方向的目标检测 mmdetection系列经典目标检测/实例分割算法原理简介和统一实现 https://z ...
深度学习计算机视觉学习路线
文章目录前言一.机器学习及OpenCV学习路线二.深度学习学习路线总结前言对于深度学习的学习从模模糊糊的入坑,恍惚间已过半年,从开始对人工智能的新奇,到现在已经完全磨灭了当初的幻想.好啦不 ...
深度学习计算机视觉发展简述
深度学习计算机视觉发展简述 1995年诞生的LeNet5网络是最早的卷积神经网络之一,也是现在很多深度神经网络架构的起点.LeNet5利用卷积.参数共享.池化等操作提取图像特征,再利用全连接神经网 ...

深度学习（计算机视觉）面试问题：

深度学习（计算机视觉）面试问题：相关推荐

最新文章

热门文章