算法原理

上一节内容讨论了如何使用线性模型进行回归模型,但要做回归任务要如何呢?
只要找一个单调可微的函数将分类任务的真实标记y与线性回归模型的预测值联系起来
在线性模型的基础上套一个映射函数来实现分类功能
sigmoid函数
f(x)=11+e−zz∈Rf(x)= \frac{1}{1+e^{-z}} z∈Rf(x)=1+e−z1​z∈R
对于这个函数的解释:最大熵,对数几率
z=wTx+bz=w^Tx+b z=wTx+b
可变化为
lny1−y=wTx+bln \frac{y}{1-y}=w^Tx+b ln1−yy​=wTx+b(1)
若将y视为样本x作为正例的可能性,则1-y是其反例的可能性,两者比值
y1−y\frac{y}{1-y}1−yy​
称为“几率”,反映了作为x作为正例的相对可能性,对几率取对数则可以得到“对数几率”:
lny1−yln \frac{y}{1-y}ln1−yy​
由此可以看出,(1)实际在用线性线性回归模型的预测结果去逼近真实标记的对数几率,其对应的模型称为“对数几率回归”。虽然他的模型叫做回归,但是实际是一种分类模型。这种方法有很多优点,例如它是直接对分类可能性进行建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题;它不是仅预测出“类别”,而是可得到近似概率预测,这对许多需利用概率辅助决策的任务很有用;此外,对率函数是任意阶可导的凸函数,有很好的数学性质,现有的许多数值优化算法都可直接用于求取最优解.
下面我们来看看如何确定w和b
上述式子可以重写为
lnP(y=1∣x)P(y=0∣x)=wTx+bln \frac{P(y=1|x)}{P(y=0|x)}=w^Tx+b lnP(y=0∣x)P(y=1∣x)​=wTx+b
显然有
P(Y=1∣x)=ewx+b1+ewx+bP(Y=1|x)=\frac{e^{wx+b}}{1+e^{wx+b}} P(Y=1∣x)=1+ewx+bewx+b​
P(Y=0∣x)=11+ewx+bP(Y=0|x)=\frac{1}{1+e^{wx+b}} P(Y=0∣x)=1+ewx+b1​
根据以上可知,在二分类中,y取值只有0,1,可以推导出其概率质量公式:

模型比较两个条件概率的大小,将实例x分到概率值较大的那一类
通过最大似然法


将概率质量公式带入最大似然公式中得:



没有闭式求解和具体公示,只有近似求解

极大似然估计-模型参数估计

  1. 确定概率质量函数
  2. 写出似然函数

信息论

用到了交叉熵
具体见南瓜书

一些小知识

概率密度函数(pdf)针对的是连续变量,例如正态分布
而概率质量函数(pmf)针对的是离散变量,例如泊松分布。

对数几率回归-逻辑回归相关推荐

  1. 逻辑斯蒂回归 逻辑回归_逻辑回归简介

    逻辑斯蒂回归 逻辑回归 Logistic regression is a classification algorithm, which is pretty popular in some commu ...

  2. 对数线性模型之一(逻辑回归), 广义线性模型学习总结

    经典线性模型自变量的线性预测就是因变量的估计值. 广义线性模型:自变量的线性预测的函数是因变量的估计值.常见的广义线性模型有:probit模型.poisson模型.对数线性模型等等.对数线性模型里有: ...

  3. oracle 逻辑回归,逻辑回归 (Logistic Regression):计算概率

    预计用时:10 分钟 许多问题需要将概率估算值作为输出.逻辑回归是一种极其高效的概率计算机制.实际上,您可以通过下两种方式之一使用返回的概率: "按原样" 转换成二元类别. 我们来 ...

  4. 西瓜书《机器学习》线性模型 对数几率(逻辑)回归公式推导

  5. 机器学习D9——逻辑回归分类

    逻辑回归 之前我们已经接触过相关的回归模型了,我们知道回归模型是用来处理和预测连续型数据的算法.然而逻辑回归是一种命名为"回归"的线性分类器,其本质是由线性回归变化而来的,一种广泛 ...

  6. 机器学习笔记(七)——逻辑回归算法

    逻辑回归(Logistic Regression,LR).在Kaggle竞赛的统计中,LR算法以63.5%的出产率,荣获各领域中"出场率最高的算法"这一殊荣.在实际场景中,逻辑回归 ...

  7. TensorFlow基础7-机器学习基础知识(逻辑回归,鸢尾花实现多分类)

    记录TensorFlow听课笔记 文章目录 记录TensorFlow听课笔记 一,线性回归 二,广义线性回归 三,一元/多元逻辑回归 四,实现一元逻辑回归 五,多分类问题 六,TensorFlow实现 ...

  8. 回归、线性回归和逻辑回归【逻辑回归部分待完成】

    一.回归 "回归"这个词很有误导性,在陈希孺的<概率论与数理统计>中对这个词的来源有过解释.是个外国人,在做数据分析的时候,发现将数据画出来后,不管大的小的数据都会有一 ...

  9. Lesson 4.1-4.2 逻辑回归模型构建与多分类学习方法逻辑回归参数估计

    Lesson 4.1 逻辑回归模型构建与多分类学习方法 首先我们来讨论关于逻辑回归的基本原理,当然,在此过程中,我们也将进一步补充机器学习数学理论基础. 逻辑回归的基本原理,从整体上来划分可以分为两个 ...

最新文章

  1. OpenCV中XML文件和YAML文件的读写
  2. [deviceone开发]-do_Dialog的基本使用示例
  3. RESTful设计原则和样例(开发前后台接口)
  4. Qt的index 用方法static_castCTableItem*(index.internalPointer())取出来的值的成员都未初始化...
  5. Yahoo 其实比你想的更糟糕!
  6. Five bugs in five minutes...
  7. java printwriter 文件_java – 如何使用printwriter创建和写入文件
  8. RDBMS数据定时采集到HDFS
  9. 【42.59%】【codeforces 602A】Two Bases
  10. ios 原生android系统下载地址,Android/iOS已有原生项目集成ReactNative
  11. andorid关于selector更换图片失效
  12. 家庭医疗系统-基于蓝牙无线通信技术
  13. 2月第4周网络安全报告:境内69.1万主机感染病毒
  14. Java之时间格式转换
  15. C语言实现线性表的链式存储结构
  16. FT232RL FTDI USB转串口芯片SSOP28 国产替代
  17. RabbitMQ队列声明channel.queueDeclare()参数解析
  18. 光滑曲线_高等数学八:(3)曲线积分与路径无关的条件
  19. Git学习总结(二)GitHub账号学生认证
  20. 最佳实践(2):iOS开发篇

热门文章

  1. 【科普】公交车超载的标准是什么?1平米最多站8人
  2. 死磕数据库系列(三十五):MySQL 数据库性能监控
  3. Dell PowerEdge R730服务器使用
  4. 【组合数学】排列组合 ( 集合组合、一一对应模型分析示例 )
  5. Spring 4 升级踩雷指南
  6. Android.mk 中 filter 和 filter-out 的用法
  7. 【Javaweb】动态web开发核心Servlet的原始真解
  8. 每个python文件就是一个模块、模块的名字就是_【填空题】每个Python文件都可以作为一个模块,模块的名字就是 的名字。...
  9. 计算机等级考试一般在什么时候?
  10. 多维度雷达图怎么做_数据可视化:柱状图、雷达图等六种基本图表的特点和适用场合...