对数几率回归-逻辑回归
算法原理
上一节内容讨论了如何使用线性模型进行回归模型,但要做回归任务要如何呢?
只要找一个单调可微的函数将分类任务的真实标记y与线性回归模型的预测值联系起来
在线性模型的基础上套一个映射函数来实现分类功能
sigmoid函数
f(x)=11+e−zz∈Rf(x)= \frac{1}{1+e^{-z}} z∈Rf(x)=1+e−z1z∈R
对于这个函数的解释:最大熵,对数几率
z=wTx+bz=w^Tx+b z=wTx+b
可变化为
lny1−y=wTx+bln \frac{y}{1-y}=w^Tx+b ln1−yy=wTx+b(1)
若将y视为样本x作为正例的可能性,则1-y是其反例的可能性,两者比值
y1−y\frac{y}{1-y}1−yy
称为“几率”,反映了作为x作为正例的相对可能性,对几率取对数则可以得到“对数几率”:
lny1−yln \frac{y}{1-y}ln1−yy
由此可以看出,(1)实际在用线性线性回归模型的预测结果去逼近真实标记的对数几率,其对应的模型称为“对数几率回归”。虽然他的模型叫做回归,但是实际是一种分类模型。这种方法有很多优点,例如它是直接对分类可能性进行建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题;它不是仅预测出“类别”,而是可得到近似概率预测,这对许多需利用概率辅助决策的任务很有用;此外,对率函数是任意阶可导的凸函数,有很好的数学性质,现有的许多数值优化算法都可直接用于求取最优解.
下面我们来看看如何确定w和b
上述式子可以重写为
lnP(y=1∣x)P(y=0∣x)=wTx+bln \frac{P(y=1|x)}{P(y=0|x)}=w^Tx+b lnP(y=0∣x)P(y=1∣x)=wTx+b
显然有
P(Y=1∣x)=ewx+b1+ewx+bP(Y=1|x)=\frac{e^{wx+b}}{1+e^{wx+b}} P(Y=1∣x)=1+ewx+bewx+b
P(Y=0∣x)=11+ewx+bP(Y=0|x)=\frac{1}{1+e^{wx+b}} P(Y=0∣x)=1+ewx+b1
根据以上可知,在二分类中,y取值只有0,1,可以推导出其概率质量公式:
模型比较两个条件概率的大小,将实例x分到概率值较大的那一类
通过最大似然法
将概率质量公式带入最大似然公式中得:
没有闭式求解和具体公示,只有近似求解
极大似然估计-模型参数估计
- 确定概率质量函数
- 写出似然函数
信息论
用到了交叉熵
具体见南瓜书
一些小知识
概率密度函数(pdf)针对的是连续变量,例如正态分布
而概率质量函数(pmf)针对的是离散变量,例如泊松分布。
对数几率回归-逻辑回归相关推荐
- 逻辑斯蒂回归 逻辑回归_逻辑回归简介
逻辑斯蒂回归 逻辑回归 Logistic regression is a classification algorithm, which is pretty popular in some commu ...
- 对数线性模型之一(逻辑回归), 广义线性模型学习总结
经典线性模型自变量的线性预测就是因变量的估计值. 广义线性模型:自变量的线性预测的函数是因变量的估计值.常见的广义线性模型有:probit模型.poisson模型.对数线性模型等等.对数线性模型里有: ...
- oracle 逻辑回归,逻辑回归 (Logistic Regression):计算概率
预计用时:10 分钟 许多问题需要将概率估算值作为输出.逻辑回归是一种极其高效的概率计算机制.实际上,您可以通过下两种方式之一使用返回的概率: "按原样" 转换成二元类别. 我们来 ...
- 西瓜书《机器学习》线性模型 对数几率(逻辑)回归公式推导
- 机器学习D9——逻辑回归分类
逻辑回归 之前我们已经接触过相关的回归模型了,我们知道回归模型是用来处理和预测连续型数据的算法.然而逻辑回归是一种命名为"回归"的线性分类器,其本质是由线性回归变化而来的,一种广泛 ...
- 机器学习笔记(七)——逻辑回归算法
逻辑回归(Logistic Regression,LR).在Kaggle竞赛的统计中,LR算法以63.5%的出产率,荣获各领域中"出场率最高的算法"这一殊荣.在实际场景中,逻辑回归 ...
- TensorFlow基础7-机器学习基础知识(逻辑回归,鸢尾花实现多分类)
记录TensorFlow听课笔记 文章目录 记录TensorFlow听课笔记 一,线性回归 二,广义线性回归 三,一元/多元逻辑回归 四,实现一元逻辑回归 五,多分类问题 六,TensorFlow实现 ...
- 回归、线性回归和逻辑回归【逻辑回归部分待完成】
一.回归 "回归"这个词很有误导性,在陈希孺的<概率论与数理统计>中对这个词的来源有过解释.是个外国人,在做数据分析的时候,发现将数据画出来后,不管大的小的数据都会有一 ...
- Lesson 4.1-4.2 逻辑回归模型构建与多分类学习方法逻辑回归参数估计
Lesson 4.1 逻辑回归模型构建与多分类学习方法 首先我们来讨论关于逻辑回归的基本原理,当然,在此过程中,我们也将进一步补充机器学习数学理论基础. 逻辑回归的基本原理,从整体上来划分可以分为两个 ...
最新文章
- OpenCV中XML文件和YAML文件的读写
- [deviceone开发]-do_Dialog的基本使用示例
- RESTful设计原则和样例(开发前后台接口)
- Qt的index 用方法static_castCTableItem*(index.internalPointer())取出来的值的成员都未初始化...
- Yahoo 其实比你想的更糟糕!
- Five bugs in five minutes...
- java printwriter 文件_java – 如何使用printwriter创建和写入文件
- RDBMS数据定时采集到HDFS
- 【42.59%】【codeforces 602A】Two Bases
- ios 原生android系统下载地址,Android/iOS已有原生项目集成ReactNative
- andorid关于selector更换图片失效
- 家庭医疗系统-基于蓝牙无线通信技术
- 2月第4周网络安全报告:境内69.1万主机感染病毒
- Java之时间格式转换
- C语言实现线性表的链式存储结构
- FT232RL FTDI USB转串口芯片SSOP28 国产替代
- RabbitMQ队列声明channel.queueDeclare()参数解析
- 光滑曲线_高等数学八:(3)曲线积分与路径无关的条件
- Git学习总结(二)GitHub账号学生认证
- 最佳实践(2):iOS开发篇
热门文章
- 【科普】公交车超载的标准是什么?1平米最多站8人
- 死磕数据库系列(三十五):MySQL 数据库性能监控
- Dell PowerEdge R730服务器使用
- 【组合数学】排列组合 ( 集合组合、一一对应模型分析示例 )
- Spring 4 升级踩雷指南
- Android.mk 中 filter 和 filter-out 的用法
- 【Javaweb】动态web开发核心Servlet的原始真解
- 每个python文件就是一个模块、模块的名字就是_【填空题】每个Python文件都可以作为一个模块,模块的名字就是 的名字。...
- 计算机等级考试一般在什么时候?
- 多维度雷达图怎么做_数据可视化:柱状图、雷达图等六种基本图表的特点和适用场合...