线性回归和逻辑回归的典型面试考点
什么是线性回归和逻辑回归 ?参考:https://blog.csdn.net/jiaoyangwm/article/details/81139362
1、有监督学习和无监督学习区别?
简单来讲:
有数据,有标签 (有监督学习)
有数据,无标签 (无监督学习)
有监督学习:对具有标记的训练样本进行学习,以尽可能对训练样本集外的数据进行分类预
测。
无监督学习:对未标记的样本进行训练学习,比发现这些样本中的结构知识。
2、分类和回归区别?
回归的输出是连续的,比如:1、2、3、4、5、6。注意,所谓“连续”意味着是有序的,是排序的。比如输出为3,那么我们可以肯定真实为3、4、5、6的可能性顺序减小,真实为2、1的可能性也是顺序减小。
分类的输出是:A类、B类、C类。注意,所谓“分类”意味着ABC之间不存在排序,不存在谁比谁更亲密或更远、可能或更不可能。输出为A,那么不意味着真实为B的可能性比C更大。
3、线性回归方程用向量化可以表示为?
f(x)=θTxf(\mathbf{x})=\theta^{T} \mathbf{x} f(x)=θTx
4、写一下线性回归损失函数,并理解下损失函数的目标?
目标是找到最好的能拟合输入数据的权重参数。我们用最小二乘法来评估拟合效果。
J(θ0,θ1,…,θn)=12m∑i=1m(hθ(x(i))−y(i))2J\left(\theta_{0}, \theta_{1}, \ldots, \theta_{n}\right)=\frac{1}{2 m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right)^{2} J(θ0,θ1,…,θn)=2m1i=1∑m(hθ(x(i))−y(i))2
5、过拟合和欠拟合各有什么问题?
欠拟合问题:模型本身能力不够,没有学习到数据的规律。
过拟合问题:模型能力很强,数据的每个点包括噪声点都能学习到,但是对新的数据预测效果很差。
6、模型的过拟合问题可以怎么解决?
有很多方法:比如获取更多数据,使用更简单的模型等等
另一种方法是使用正则化项,因为过拟合是因为模型太复杂了,对应于线性回归,说明某些权重参数对模型的影响过大或者多余了,我们可以通过加一个正则化项,模型训练时,相当于最小化下面公式的损失函数时,会把一些对模型复杂度影响很大的权重参数的权重数值变小,这样曲线就变得比较平滑了,可以消减模型的复杂度。
J(θ)=12m[∑i=1m(hθ(x(i))−y(i))2+λ∑j=1nθj2]J(\theta)=\frac{1}{2 m}\left[\sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right)^{2}+\lambda \sum_{j=1}^{n} \theta_{j}^{2}\right] J(θ)=2m1[i=1∑m(hθ(x(i))−y(i))2+λj=1∑nθj2]
7、逻辑回归明明是分类问题,为什么又叫回归?
因为逻辑回归还是以线性回归为基础的,只是加了一个sigmoid函数,才具有了分类的功能。sigmoid函数表达式如下
8、逻辑回归为什么不用平方损失函数?
因为逻辑回归的平方损失函数是非凸函数,梯度下降时很难得到全局极值点。
9、写一下逻辑回归损失函数,并理解是怎么来的?
这个损失函数是凸函数,梯度下降可以找到全局极值点。
J(θ)=−1m[∑i=1my(i)loghθ(x(i))+(1−y(i))log(1−hθ(x(i)))]+λ2m∑j=1nθj2J(\theta)=-\frac{1}{m} \left[ \sum_{i=1}^{m} y^{(i)} \log h_{\theta}\left(x^{(i)}\right)+\left(1-y^{(i)}\right) \log \left(1-h_{\theta}\left(x^{(i)}\right)\right)\right]+\frac{\lambda}{2 m} \sum_{j=1}^{n} \theta_{j}^{2} J(θ)=−m1[i=1∑my(i)loghθ(x(i))+(1−y(i))log(1−hθ(x(i)))]+2mλj=1∑nθj2
其中λ2m∑j=1nθj2\frac{\lambda}{2 m} \sum_{j=1}^{n} \theta_{j}^{2}2mλj=1∑nθj2 是一个正则化项
10、LR逻辑回归这个模型有什么优势?
- LR能以概率的形式输出结果,而非只是0,1判定
- LR的可解释性强,可控度高
- 训练快,feature engineering之后效果赞
- 因为结果是概率,可以做ranking model
- 添加feature太简单…
线性回归和逻辑回归的典型面试考点相关推荐
- 线性回归、逻辑回归、损失函数
回归问题的条件/前提: 1) 收集的数据 2) 假设的模型,即一个函数,这个函数里含有未知的参数,通过学习,可以估计出参数.然后利用这个模型去预测/分类新的数据. 1. 线性回归 假设 特征 和 结果 ...
- Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS
Spark MLlib回归算法------线性回归.逻辑回归.SVM和ALS 1.线性回归: (1)模型的建立: 回归正则化方法(Lasso,Ridge和ElasticNet)在高维和数据集变量之间多 ...
- 语言线性拟合线对称_文科生都能看懂的机器学习教程:梯度下降、线性回归、逻辑回归...
[新智元导读]虽然在Coursera.MIT.UC伯克利上有很多机器学习的课程,包括吴恩达等专家课程已非常经典,但都是面向有一定理科背景的专业人士.本文试图将机器学习这本深奥的课程,以更加浅显易懂的方 ...
- 逻辑回归(Logistic Regression):线性回归与逻辑回归的来龙去脉
文章目录 Intro Logistic Regression 1. 回归的预测形式 1.1 线性回归的单变量形式 1.2 线性回归的多变量形式 1.3 逻辑回归:将线性回归转化为概率模型 1.4 逻辑 ...
- 对线性回归、逻辑回归、各种回归的概念学习
回归问题的条件/前提: 1) 收集的数据 2) 假设的模型,即一个函数,这个函数里含有未知的参数,通过学习,可以估计出参数.然后利用这个模型去预测/分类新的数据. 1. 线性回归 假设 特征 和 结果 ...
- 机器学习:线性回归和逻辑回归
线性回归和逻辑回归的区别: 两者都属于回归算法,线性回归主要用来解决连续值预测的问题,逻辑回归用来解决分类的问题,输出的属于某个类别的概率,工业界经常会用逻辑回归来做排序.在SVM.GBDT.AdaB ...
- 线性回归,逻辑回归的学习(包含最小二乘法及极大似然函数等)
回归问题的前提: 1) 收集的数据 2) 假设的模型,即一个函数,这个函数里含有未知的参数,通过学习,可以估计出参数.然后利用这个模型去预测/分类新的数据. 1. 线性回归 假设 特征 和 结果 都满 ...
- R语言使用broom包将回归模型(线性回归、逻辑回归、比例风险回归)的结果整理成dataframe并导出到excel等文件中:基于mtcars和colon数据集
R语言使用broom包将回归模型(线性回归.逻辑回归.比例风险回归)的结果整理成dataframe并导出到excel等文件中:基于mtcars和colon数据集 目录
- 机器学习简介之基础理论- 线性回归、逻辑回归、神经网络
http://blog.itpub.net/29829936/viewspace-2640084/ 本文主要介绍一些机器学习的基础概念和推导过程,并基于这些基础概念,快速地了解当下最热技术AI的核心基 ...
最新文章
- 安卓开发37:自定义的HorizontalScrollView类,使其pageScroll的时候焦点不选中
- java dagger2_从零开始搭建一个项目(rxJava+Retrofit+Dagger2) --完结篇
- arcgis java api_Arcgis API For Javascript下载与安装
- java多线程编程——锁优化
- jdk170不支持注释_JDK 9 @不建议使用的注释增强功能
- 戴尔r720服务器增加内存,dell r720服务器加了一根内存后,开机显示configuring memory,卡在这里进不了系统,请问这是什么情况?...
- Luogu4755 Beautiful Pair 最值分治、主席树
- 《Java核心技术 卷Ⅱ 高级特性(原书第10版)》一3.6.2 使用StAX解析器
- 京东:截至11月11日00:09 累计下单金额超2000亿元
- 使用web进行数据库管理
- 【Oracle】DataGuard中 Switchover 主、备切换
- Android java和C的Socket通信demo(可用)
- float的比较要慎重
- 阿里、美团内部大数据资料!果然牛逼!
- gps面积测量仪手机版下载安装_GPS面积测量仪手机版下载
- 笔记 GWAS 操作流程2-5:杂合率检验
- 一键批量下载皮皮虾视频
- 阿里P9大佬手写的Java核心开发手册(2022版)覆盖P5到P8所有技术栈
- Java设计模式之——策略模式
- Google 2020 应用与游戏出海 12 月刊: 年终盘点特辑
热门文章
- Java 生成二维码 zxing生成二维码 条形码 服务端生成二维码 Java生成条形码
- android AV流程
- php中文的正则表达式_php 正则表达式匹配中文汉字
- 进程,线程与多核,多cpu之间的关系
- 图片转PDF有哪些软件?这几款软件建议收藏
- html向下滚动条,《html》不显示滚动条,鼠标滑轮可以控制向下滚动是怎么回事?...
- 使用XPath的爬虫
- python运行调出控制台_python控制台怎么打开
- Linux系统如何PING地址,Linux下指定源ip进行ping操作的方法
- win10 常用命令