1、logistic回归的应用场景
Logistic回归是一种用于解决二分类问题的机器学习方法,是一种判别模型:表现为直接对条件概率P(y|x)建模,而不关心背后的数据分布P(x,y)

用于估计某种事物的可能性。比如某用户购买某商品的可能性、某病人患有某种疾病的可能性、以及某广告被用户点击的可能性等。

注意:这里用的是“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。

2、为什么损失函数不选MSE,而采用极大似然估计?
答:对于线性回归,我们会选择MSE, 因为其J(θ)是凸函数,但是对于logistic回归,由于进行了sigmoid非线性映射就是非凸函数,所以可能在寻优的时候容易陷入局部最优,所以考虑把sigmoid作log,得到的J(θ)为:

logistic损失函数.png

对其求二阶导,结果大于0,说明其是凸函数,在用梯度下降法寻优时,可以保证找到全局最小。

3、logistic回归和线性回归的关系是什么?
(1) 逻辑回归的条件分布y|x是伯努利分布,而线性回归的是高斯分布,因为逻辑回归的因变量是二元变量(0或1)
(2)逻辑回归是在线性回归的基础上,多一步sigmoid非线性映射。所以线性回归模型对异常值敏感,而逻辑回归通过非线性变换减弱分离平面较远的点的影响。
(3)逻辑回归和线性回归问题中,梯度下降算法的形式看上去是一致的(更新参数的规则看起来基本相同),但实际上两者是完全不同的,因为假设函数是不同的,需要特别注意这一点。
4、logistic回归为什么是线性模型?
很容易可以从sigmoid函数看出,当θTx>0 时,y=1,否则 y=0。θTx=0 是模型隐含的分类平面(在高维空间中,我们说是超平面),所以说logistic回归本质上是一个线性模型。

注意:这里需要区分假设函数和决策边界:

在逻辑回归中,假设函数(h=g(z))用于计算样本属于某类别的可能性;决策函数(h=1(g(z)>0.5))用于计算(给出)样本的类别;决策边界(θ^Tx=0)是一个方程,用于标识出分类函数(模型)的分类边界。

5、logistic回归的优点和缺点?
优点:
(1)模型相对简单并且可解释性非常好。
(2)从特征的权重可以看到不同的特征对最后结果的影响,某个特征的权重值比较高,那么这个特征最后对结果的影响会比较大。
(3)模型效果不错,在工程上是可以接受的(作为baseline),如果特征工程做的好,效果不会太差。
(4)训练速度较快。分类的时候,计算量仅仅只和特征的数目相关。(5)逻辑回归可以很方便的得到最后的分类结果,因为输出的是每个样本的概率分数,我们可以很容易的对这些概率分数进行cutoff,也就是划分阈值。

缺点:
(1) 对模型中自变量多重共线性较为敏感,例如两个高度相关自变量同时放入模型,可能导致较弱的一个自变量回归符号不符合预期,符号被扭转。​需要利用因子分析或者变量聚类分析等手段来选择代表性的自变量,以减少候选变量之间的相关性;

(2) 预测结果呈“S”型,因此从log(odds)向概率转化的过程是非线性的,在两端随着​log(odds)值的变化,概率变化很小,边际值太小,slope太小,而中间概率的变化很大,很敏感。 导致很多区间的变量变化对目标概率的影响没有区分度,无法确定阀值。

(3) 很难处理数据不平衡的问题。举个例子:如果我们对于一个正负样本非常不平衡的问题,把所有样本都预测为正也能使损失函数的值比较小。但是作为一个分类器,它对正负样本的区分能力不会很好。

(4) 逻辑回归本身无法筛选特征。有时候,我们会用gbdt来筛选特征,然后再上逻辑回归。

logistic回归--好文相关推荐

  1. logit回归模型假设_一文让你搞懂Logistic回归模型

    注:本文是我和夏文俊同学共同撰写的 现考虑二值响应变量 ,比如是否购车,是否点击,是否患病等等,而 是相应的自变量或者称特征.现希望构建一个模型用于描述 和 的关系,并对 进行预测. 线性模型可以吗? ...

  2. 二值logit模型的适用条件_一文读懂条件Logistic回归

    在医学研究中,为了控制一些重要的混杂因素,经常会把病例和对照按年龄,性别等条件进行配对,形成多个匹配组.各匹配组的病例数和对照人数是任意的,比如一个病例和若干个对照匹配即1:1,在医学上称作" ...

  3. 一文理解二元logistic回归

    目录 1.二元logistic分析思路说明 2.如何使用SPSSAU进行二元logistic操作 3.二元logistic相关问题 在研究X对于Y的影响时,如果Y为定量数据,那么使用多元线性回归分析( ...

  4. 一文掌握多分类logistic回归

    Logistic回归分析(logit回归)一般可分为3类,分别是二元Logistic回归分析.多分类Logistic回归分析和有序Logistic回归分析.logistic回归分析类型如下所示. Lo ...

  5. logit回归模型假设_一文读懂条件Logistic回归

    在医学研究中,为了控制一些重要的混杂因素,经常会把病例和对照按年龄,性别等条件进行配对,形成多个匹配组.各匹配组的病例数和对照人数是任意的,比如一个病例和若干个对照匹配即1:1,在医学上称作" ...

  6. logistic回归和最大熵

    回顾发现,李航的<统计学习方法>有些章节还没看完,为了记录,特意再水一文. 0 - logistic分布 如<统计学习方法>书上,设X是连续随机变量,X服从logistic分布 ...

  7. 多元有序logistic回归_医学统计与R语言:多分类logistic回归HosmerLemeshow拟合优度检验...

    微信公众号:医学统计与R语言如果你觉得对你有帮助,欢迎转发 输入1:multinominal logistic regression install.packages("nnet" ...

  8. 【theano-windows】学习笔记七——logistic回归

    前言 前面只是学了最基本的theano操作,但是theano中还有很多其他的东西,比如图结构,自定义函数等,这些暂时没有用到就先不看了,后续学啥用啥,没必要一口气吃个胖子,免得消化不良还把前面吃的东西 ...

  9. 二元置信椭圆r语言_医学统计与R语言:多分类logistic回归HosmerLemeshow拟合优度检验...

    微信公众号:医学统计与R语言如果你觉得对你有帮助,欢迎转发 输入1:multinominal logistic regression "nnet") 结果1: test (mult ...

最新文章

  1. 苹果Swift语言中文教程资源汇总
  2. stealwatch里的安全功能——ETA结果会显示加密套件以及key长度,还有流量大小(例如41MB)...
  3. 给FreeBSD加上了防火墙
  4. 5、CSS 外边距合并
  5. 触摸屏通常接在微型计算机,计算机应用基础习题答案.doc
  6. wxWidgets:wxScrollBar类用法
  7. 怎么把python程序发给别人_想把你写的Python程序发给别人用?打包成exe啊!
  8. 数据结构与算法--数组中的逆序对
  9. gitlab git clone 卡住_IDEA中的Git操作你掌握了吗?此一篇,足矣!
  10. Debug程序的使用
  11. XSS的盲打以及实验的演示
  12. [LeetCode] Trapping Rain Water II 题解
  13. 求解偏微分方程开源有限元软件deal.II学习--Step 12
  14. springer论文模板参考文献的顺序问题
  15. 领域驱动设计战术模式:领域事件
  16. 前端要怎么学,前端学习路线图
  17. #我的第二十一堂云计算课# #开源数据库MySQL DBA运维实战 第2章 SQL1#
  18. 初识神经网络——损失函数
  19. 计算机逻辑练习题,逻辑学综合练习题集答案
  20. 支付宝固码接口文档-hook

热门文章

  1. ubuntu虚拟机apt报错:No module named ‘uaclient‘(替换所有的python3为/usr/bin/python3)xftp、xshell不能连接
  2. 如何理解Linux shell中的“2>1”(将文件描述2(标准错误输出)的内容重定向到文件描述符1(标准输出))(尼玛>符号竟然不支持搜索,害我搜搜不到,只能搜)
  3. 芯片-模组-开发板-软件开发包SDK(Software Development Kit)的关系(软件开发人员必须了解的硬件知识)
  4. CMD是什么?(命令行提示符)如何使用python在windows上操作CMD?(python执行命令行)os.syste[m](执行的命令)、os.popen(执行的命令)
  5. Linux下的Ubuntu16.04系统配置并使用USB转串口(串口转USB),最终使用python的serial和pyserial包实现串口的打开并读取数据
  6. 蓝桥杯C++ AB组辅导课 第一讲 递归与递推 Acwing
  7. Divan and a New Project 贪心,模拟(1000)
  8. docker环境安装redis
  9. java 数组 push pop_JavaScript学习笔记:数组的push()、pop()、shift()和unshift()方法
  10. 中秋我用CSS写了个嫦娥奔月