Logistic模型

logistic回归又称logistic回归分析,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率,等等。例如,想探讨胃癌发生的危险因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群肯定有不同的体征和生活方式等。这里的因变量就是–是否胃癌,即“是”或“否”,为两分类变量,自变量就可以包括很多了,例如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是离散的。通过logistic回归分析,就可以大致了解到底哪些因素是胃癌的危险因素。

与多重线性回归的比较:
logistic回归(Logistic regression) 与多重线性回归实际上有很多相同之处,最大的区别就在于他们的因变量不同,其他的基本都差不多,正是因为如此,这两种回归可以归于同一个家族,即广义线性模型(generalized linear model)。这一家族中的模型形式基本上都差不多,不同的就是因变量不同,如果是连续的,就是多重线性回归,如果是二项分布,就是logistic回归,如果是poisson分布,就是poisson回归,如果是负二项分布,就是负二项回归,等等。只要注意区分它们的因变量就可以了。

logistic回归的因变量可以是二分非线性差分方程类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。

logistic回归模型:

逻辑回归(Logistic Regression)是机器学习中最常见的一种用于二分类的算法模型,由于其数学原理简单易懂,作用高效,其实际应用非常广泛。虽然带回归二字,实则是分类模型,下面从logit变换开始。

logit变换:

*Logit模型(Logit model,也译作“评定模型”,“分类评定模型”,又作Logistic regression,“逻辑回归”)是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。

线性回归模型的一个局限性是要求因变量是定量变量(定距变量、定比变量)而不能是定性变量(定序变量、定类变量)。但是在许多实际问题中,经常出现因变量是定性变量(分类变量)的情况。可用于处理分类因变量的统计分析方法有:判别分析( Discriminantanalysis)、 Probit分析、 Logistic回归分析和对数线性模型等。在社会科学中,应用最多的是 Logistic回归分析。

Logistic回归分析根据因变量取值类别不同,又可以分为二元 Logistic回归分析和多元 Logistic回归分析,二元 Logistic回归模型中因变量只能取两个值1和0(虚拟因变量),而多元 Logistic回归模型中因变量可以取多个值。逻辑分布(Logistic distribution)公式:

P(Y=1│X=x)=exp(x’β)/(1+exp(x’β)) 其中参数β常用极大似然估计。

Logit模型是最早的离散选择模型,也是应用最广的模型。Logit模型是Luce(1959)根据IIA特性首次导出的;Marschark(1960)证明了Logit模型与最大效用理论的一致性;Marley(1965)研究了模型的形式和效用非确定项的分布之间的关系,证明了极值分布可以推导出Logit形式的模型。

McFadden(1974)反过来证明了具有Logit形式的模型效用非确定项一定服从极值分布。

此后Logit模型在心理学、社会学、经济学及交通领域得到了广泛的应用,并衍生发展出了其他离散选择模型,形成了完整的离散选择模型体系,如Probit模型、NL模型(Nest Logit model)、Mixed Logit模型等。

Logit模型的应用广泛性的原因主要是因为其概率表达式的显性特点,模型的求解速度快,应用方便。当模型选择集没有发生变化,而仅仅是当各变量的水平发生变化时(如出行时间发生变化),可以方便的求解各选择枝在新环境下的各选择枝的被选概率。根据Logit模型的IIA特性,选择枝的减少或者增加不影响其他各选择之间被选概率比值的大小,因此,可以直接将需要去掉的选择枝从模型中去掉,也可将新加入的选择枝添加到模型中直接用于预测。

Logit模型这种应用的方便性是其他模型所不具有的,也是模型被广泛应用的主原因之一。*

软件实现方式:

在stata中,logistic回归可以得到很好的实现。主要命令为:

logistic hcv age marry sex

其中,logistic为主命令,hcv为因变量,后面的三个变量依次为自变量。
如果自变量既存在哑变量又存在连续变量,系统自带的help里面没有提到,可用如下方式:

xi:logistichcvagei.marryi.sex

其中,xi表示后面带i.的变量将自动变为哑变量。

分岔图(MATLAB实现):

clc, clear;
x = 0.5;
i  =  1;
for mu=0:0.00001:2x = 1-mu*x*x;y(i) = x;i = i+1;
end
plot(0:0.00001:2,y,'.');
hold on
xlabel('\mu');
ylabel('x');

Logistic模型相关推荐

  1. 二元logistic模型案例_二元逻辑回归的简介与操作演示

    二元逻辑回归介绍 定义 Logistic回归主要用于因变量为分类变量(如是否等)的回归分析,自变量可以为分类变量,也可以为连续变量.它可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用 ...

  2. sklearn基于make_scorer函数为Logistic模型构建自定义损失函数并可视化误差图(lambda selection)和系数图(trace plot)+代码实战

    sklearn基于make_scorer函数为Logistic模型构建自定义损失函数并可视化误差图(lambda selection)和系数图(trace plot)+代码实战 # 自定义损失函数 i ...

  3. sklearn基于make_scorer函数为Logistic模型构建自定义损失函数+代码实战(二元交叉熵损失 binary cross-entropy loss)

    sklearn基于make_scorer函数为Logistic模型构建自定义损失函数+代码实战(二元交叉熵损失 binary cross-entropy loss) # 广义线性模型中的各种连接函数: ...

  4. R语言应用实战-基于R浅谈SEIR传染病模型以以及马尔萨斯,logistic模型(推导过程和源代码)

    前言 关于传染病SEIR模型,接下来我们分为以下几块内容讨论:一传染病的数学模型原理,二.R语言代码实现,三.常见错误以及相关其他模型的讨论(马尔萨斯模型和logistic模型). 以下是我为大家准备 ...

  5. 存档丢失以后再补之R语言与logistic模型

    学习笔记 参考书目:<计量经济学基础>,<计量经济学>,<统计学:数据到结论> 由于写了半天电脑蹦了,存档丢失,故以后再写 线性概率模型LPM(A541) LPM以 ...

  6. logistic模型原理与推导过程分析(3)

    附录:迭代公式向量化 θ相关的迭代公式为: ​ 如果按照此公式操作的话,每计算一个θ需要循环m次.为此,我们需要将迭代公式进行向量化. 首先我们将样本矩阵表示如下: 将要求的θ也表示成矩阵的形式: 将 ...

  7. logistic模型原理与推导过程分析(2)

    二项逻辑回归模型 既然logistic回归把结果压缩到连续的区间(0,1),而不是离散的0或者1,然后我们可以取定一个阈值,通常以0.5为阈值,如果计算出来的概率大于0.5,则将结果归为一类(1),如 ...

  8. logistic模型原理与推导过程分析(1)

    从线性分类器谈起 给定一些数据集合,他们分别属于两个不同的类别.例如对于广告数据来说,是典型的二分类问题,一般将被点击的数据称为正样本,没被点击的数据称为负样本.现在我们要找到一个线性分类器,将这些数 ...

  9. Gompertz模型绘图 matlab,Logistic模型matlab求解

    Logistic模型求解怎么用matlab求解啊? 悬赏分:100 - 解决时间:2008-11-17 23:09 已知 x=0:1:12 y=[43.65 109.86 187.21 312.67 ...

  10. 运用Logistic模型检验影响企业现金分红的主要因素

    运用Logistic模型检验影响企业现金分红的主要因素 现金股息是以现金形式支付的股息和红利 , 是最普通.最基本的股息形式,是成熟资本市场最常见的股利形式,在我国 一般被称为"红利&quo ...

最新文章

  1. 你知道 int(1) 和 int(10) 的区别吗?
  2. 软件公司与非软件公司区别(纯个人看法)
  3. ACL 2016 | Modeling Coverage for Neural Machine Translation
  4. 安卓下载保存到本地(二)
  5. 【maven3学习之三】maven构建一个简单的Hello World
  6. cyclicbarrier_Java并发– CyclicBarrier示例
  7. C#LeetCode刷题-设计
  8. 深度学习 AI入门-1
  9. 时空图卷积神经网络(st-gcn)论文解读
  10. java 俄语月份,适当的俄语月字符串翻译Java
  11. 23.C++- 继承的多种方式、显示调用父类构造函数、父子之间的同名函数、virtual虚函数...
  12. ubuntu14.04(server amd64)免密码sudo
  13. Mycat的使用 - 03.全局序列号
  14. 聚类精确度(Cluster Accuracy)
  15. 决策树C4.5算法对ID3算法的改进
  16. 介绍几种wifi电源管理模式
  17. 【架构师】零基础到精通——网关详解
  18. 【C++】使用VS2022和GCC编译Xlnt库读取EXCEL
  19. docker创建容器共享目录
  20. mac无线网连上没网络连接网络连接服务器,无线网络连接上但上不了网

热门文章

  1. 海信电视 LED55K370 升级固件总结【含固件下载地址】
  2. PHP UTF-8转GBK
  3. 手机号码归属地查询,手机号码归属地批量查询
  4. 用户画像pdf_【金猿产品展】易观方舟:智能用户数据中台
  5. Google Chrome谷歌浏览器繁体字修改为简体字
  6. Java获取名字首字母拼音及用户按名字拼音分组工具
  7. 神经网络学习小记录55——Keras搭建常见分类网络平台(VGG16、MobileNet、ResNet50)
  8. vue中引用BScroll监听上拉加载报错
  9. 觅风易语言[1-10]
  10. U8v10.1 出纳票据打印在 Nantian PR2E上打印不正确问题的解决方法