百面机器学习和百面深度学习-测试1
11
1.特征归一化:
数据的量纲和大小不同会导致数据对模型的影响程度不同,每个特征对模型造成的影响不同。
2.怎么处理类别特征:
(类似于男女之类的类别)one-hot编码
3.什么是组合特征,怎么处理高维组合特征
多个特征组合到一起,高维组合特征进行特征降维为低维特征
4.怎么有效的找到组合特征:
构造决策树来寻找组合特征
5.如何缓解图像分类任务数据量不足?
数据增强,生成对抗网络生成数据
22
1.准确率的局限性:
正负样本数据比重不同时准确率会不准
2.精确率和召回率:
精确率:预测为正是正确的。召回率:预测为正是正确的总的。
PR曲线,以及F1分数
3.平方根误差的意外
RMSE能够很好地反应回归模型预测值与真实值的偏离程度,受到了异常值的影响。
4.在线A/B测试
离线和在线遇到的问题不同,处理可能离线遇不到的问题。
5.过拟合和欠拟合:
过拟合:模型复杂,在训练数据好测试数据不好
欠拟合:在训练和测试数据上都表现不好
6.ROC曲线:
横坐标是假阳性率(假的阳性占真正假的),纵坐标是真阳性率(真的阳性占真正的真的)。
7.计算AUC:
ROC的面积大小,该值能够量化地反应基于ROC曲线衡量出的模型的性能。
8.余弦相似度:
因为欧式距离在某些情况下不能正确的评判。
机器学习中特征使用向量表示。
余弦定理并不是一个真正的距离计算公式。
9.模型评估中的验证方法:
交叉验证:时间比较久
自助法
10.将低过拟合和欠拟合:
过拟合:降低模型的复杂度,数据增强,dropout,正则化
欠拟合:修改模型,数据增强
11.ROC和PR
ROC是假阳性率和真阳性率
PR是召回率和准确率。
12.超参数调优:
网格搜索,随机搜索,贝叶斯优化算法
33
1.逻辑回归和线性回归
一个是分类一个是回归。损失函数不一样逻辑回归是交叉熵损失,并且是线性回归后加了一个激活函数
2决策树的启发函数
ID3最大信息增益、C4.5最大信息增益比、CART最大基尼指数
4.使用逻辑回归处理多标签
可以使用多个分类器
5.决策树剪枝:
预剪枝和后剪枝
百面深度学习
1.简述卷积的基本操作,并分析其与全连接层的区别
卷积或的特征图的更高层的语义特征。全连接层输出单元和每个输入单元都相连接。卷积局部连接,用一个卷积核权值共享。
2.在卷积神经网络中如何计算各层的感受野的大小:
感受野的大小核步长与卷积核的大小有关。以及上一层的感受野的大小有关
3.分组卷积及其应用场景:
输出通道核输入通道全部相连接,但是分组卷积将它们分开了。在不同计算机上进行训练,对计算机的算力要求较低。
4.空洞卷积的设计思路
在卷积核中加几个空洞,但是增大了感受野。
5.转置卷积
转置卷积主要用于进行上采样
6.可变变形卷积
检测的物体的形状不够规整
7.批归一化。
解决神经网络在参数更新以后原有的数据特征不一致,一般放在激活函数之前或者之后没有一个明确的说法。
8.用于分类的网络的最后几层:
一般是全连接层,但是由于近几年全卷积,使得图片的输入大小可以不同
9.Alexnet第一CNN
Resnet加入了残差网络
66
1.强化学习?使用马尔可夫描述强化学习
强化学习主要是智能体和环境之间的关系。
策略,收益,动作,状态以及状态转移矩阵
2.时序差分和蒙特卡洛强化学习。
前者不是遍历所有状态才更新,是边走边更新后者要全部经历才能更新。
3.策略迭代是找到一个收益最大的策略,价值迭代是维护一个价值表,没有显式的策略
4.Q-learning
维护一个价值表
9
1.单步检测和双步检测
单步快,双步慢,双步对于box要进行对此回归校正,精度高
2.增强小物体的检测
图像增强,增大网络模型的深度,增大感受野
3.
百面机器学习和百面深度学习-测试1相关推荐
- 黄海广博士的机器学习个人笔记及深度学习笔记
想要下载黄海广博士的机器学习个人笔记及深度学习笔记的请复制下面链接 https://download.csdn.net/download/wgllovemother/10447758 备注:有想下载 ...
- 机器学习如何选择模型 机器学习与数据挖掘区别 深度学习科普
今天看到这篇文章里面提到如何选择模型,觉得非常好,单独写在这里. 更多的机器学习实战可以看这篇文章:http://www.cnblogs.com/charlesblc/p/6159187.html 另 ...
- Python工程能力进阶、数学基础、经典机器学习模型实战、深度学习理论基础和模型调优技巧……胜任机器学习工程师岗位需要学习什么?...
咱不敢谈人工智能时代咋样咋样之类的空话,就我自己来看,只要是个营收超过 5 亿的互联网公司,基本都需要具备机器学习的能力.因为大部分公司盈利模式基本都会围绕搜索.推荐和广告而去. 就比如极客时间,他的 ...
- 机器学习(Machine Learning)、深度学习(Deep Learning)、NLP面试中常考到的知识点和代码实现
网址:https://github.com/NLP-LOVE/ML-NLP 此项目是机器学习(Machine Learning).深度学习(Deep Learning).NLP面试中常考到的知识点和代 ...
- 机器学习笔记——神经网络与深度学习
机器学习笔记--神经网络与深度学习 一.神经网络引言 二.神经元模型与激活函数 2.1 神经元模型 2.2 激活函数 2.2.1 sigmoid & tanh 2.2.2 ReLU激活函数 2 ...
- 什么是人工智能?什么是机器学习?什么是深度学习?三连问
人工智能 人工智能 机器学习 有监督学习 无监督学习 半监督学习 强化学习 深度学习 神经网络 三者之间的关系 最近机器学习,深度学习频繁出现人工智能领域,成为高频词汇,但是好多同学对这些同学一知半 ...
- 传统的机器学习目标检测和深度学习的目标检测
概述: 目标分类:给一张图片,分类 目标检测:给一张图片,找到目标,并用矩形框画出 分类是对一幅图整体,检测是更进一步,找出一幅图中一部分.一般检测以分类为基础, 如用滑动窗口搜索,然后用分类器分类是 ...
- 剖析大数据、人工智能、机器学习、神经网络、深度学习五者之区别与联系
1 引言 当下时代,无论你是否专业于CS,想必都应当听过大数据.人工智能.机器学习.神经网络与深度学习这几个热词.他们区别明显却又联系紧密,有些互有交集,有些又是另一部分的子集.基于上述原因,现作文一 ...
- 读懂人工智能、机器学习、神经网络和深度学习的关系
最近很长的一段时间,人工智能的热度都维持在一定的高度.但是大家在关注或研究人工智能领域的时候,总是会遇到这样的几个关键词:深度学习.机器学习.神经网络.那他们之间到底是什么样的关系呢? 先说人工智能, ...
- 探讨使用UML设计机器学习特征工程与深度学习建模等大数据分析软件
大数据人工智能软件产品研发,是在传统软件工程的基础上,增加了数据特征分析.人工智能算法建模及模型训练过程,同时也增加了很大的不确定性. 0. 前言 本文以程序员视角,以客户流失为案例,使用UML方式设 ...
最新文章
- 数据不一致问题排查1
- 小学4年级计算机课,小学四年级信息技术课件
- .net获取地址栏中的url
- Linux(六) 磁盘与文件系统
- win10 mysql5.7.11_Windows10安装与配置MySQL-5.7.11
- 校园计算机知识竞赛活动简介,徽县一中计算机爱好者社团成功举办计算机知识竞赛活动...
- [译]Go语言常用文件操作汇总
- linux下安装gcc
- 基于高斯分布和OneClassSVM的异常点检测
- 28. (附加)字符串的组合(C++版本)
- GBase数据库迁移工具介绍
- 水哥王昱珩直播解锁华为Mate 20黑科技,超微距效果实力非凡
- 004_simulink建立子系统
- IE6躲躲猫bug -IE6 Peekaboo Bug
- 01 APP被苹果APPStore拒绝的各种原因
- 【二分】Caravan Robbers
- STM8S自学笔记之利用库函数点亮一个LED
- 阿里云二手域名哪些值得买?
- JAVA面向对象学习心得
- 肿瘤免疫新抗原鉴定(一)OptiType安装与运行
热门文章
- 【回答问题】ChatGPT上线了!给我推荐20个比较流行的自动驾驶算法模型
- 全球最大多物种水族馆将于5月23日向公众开放,容纳68000多只海洋动物 | 美通社头条...
- 离线地图-geoserver
- 春松客服:一个开源的智能客服系统
- 【实验五 一维数组】7-6 sdut- C语言实验-数日子
- matlab 画多个箱线图
- 谷歌浏览器上启用flash_如何在任何Web浏览器上启用私人浏览
- js 设置视频的音量大小
- 机器学习-*-K均值聚类及代码实现
- XRouter 一个轻量级的Android路由框架,基于ARouter上进行改良,优化Fragment的使用,可结合XPage使用