机器学习笔记(二十):逻辑回归(2)
凌云时刻 · 技术
导读:在这一篇笔记中我们继续来学习分类算法逻辑回归(Logistic Regression)。
作者 | 计缘
来源 | 凌云时刻(微信号:linuxpk)
定义损失函数
回顾完对数后,我们再来看看逻辑回归的损失函数,没错,我们就是要使用对数的函数来表示:
如果,那么损失函数为:如果,那么损失函数为:
我们来看看这两个函数为什么符合之前我们定义的损失函数的描述。首先 的曲线为:
之前说了,概率的值域在(0,1)(0,1)之间,所以上图曲线的x轴以下的曲线是没有意义的,所以对于 ,它的曲线是:
从上面的曲线图可以很容易的发现,当 趋近于0的时候, 趋近于正无穷,这个正无穷其实就是一个很大的损失惩罚,因为当 趋近于0时, 应该也是趋近于0,但是这里 定义的是1。当 在不断趋近1的过程中, 的值逐渐减小,既损失逐渐减小,当 趋近于1时, 应该也是趋近于0,和这里定义的是一致的,所以 的值是0,说明没有损失。
下面再来看看 的曲线:
同理因为概率的值域在(0,1)之间,所以 的曲线为:
这条曲线同样可以解释我们之前定义的损失趋势。
此时我们找到的损失函数还是根据不同的分类分成了两个,其实将其合成一个也很简单:
如此一来,当 时,损失函数为 ,当 时,损失函数为 。
上面的公式,是针对一个样本数据的,那么如果有多个样本数据,其实就是将这些样本数据的损失值加起来然后在求一下平均值:
下面我们要做的就是找到一组 值,使得上面的 达到最小值。
损失函数的梯度
上面的公式是没法像线性回归那样求出一个正规方程解的,所以我们需要使用梯度下降法来求得使 最小的一组 。下面我们先把公式都列出来:
多元线性回归公式: ,注意这里的 是加上了值全部为1的一列的矩阵,而为了方便推导,这里的 是一个列向量,就不写成 了。
Sigmoid函数: 。
逻辑回归概率公式:
逻辑回归损失函数:
在第五篇笔记中我们知道,求损失函数的梯度就是对 这个列向量逐个元素求导:
我们从里往外来看,先从Sigmoid函数求导入手。
Sigmoid函数求导
先变换一下Sigmoid函数:
然后对Sigmoid函数求导,这里遵循求导链式法则以及求导基本法则:
复合函数 的导数 为:
代数函数导数:
数学常数的指数求导还是它自己:
所以可得Sigmoid函数的导数为:
Sigmoid函数的对数求导
下面再往外扩展,来看一下 的导数。这里遵循的导数法则为:
对以2为底的对数求导:
复合函数 的导数 为:
所以 的导数为:
log(σ(t))‘=1σ(t)⋅σ(t)‘=1(1+et)−1⋅(1+e−t)−2⋅e−t=(1+e−t)−1⋅e−t=e−t1+e−t=1+e−t−11+e−t=1−11+e−t=1−σ(t)
的导数为:
逻辑回归损失函数求导
当我们知道了Sigmoid函数和Sigmoid函数的对数的求导结果后,我们对逻辑回归损失函数求导就很容易了(这里对第 个 求导),先来看前半部分:
最后的那个 是第 个 前面的系数,再来看后半部分:
此时对整个损失函数求导就是上面两部分相加:
所以逻辑回归损失函数的梯度为:
大家再来回顾一下第五篇笔记中线性回归的梯度:
可以发现这两个梯度在形态上是非常相似的,因为线性回归的梯度通过向量化可以优化为:
所以逻辑回归的梯度最终可以写为:
实现逻辑回归算法
因为逻辑回归拟合损失函数使用的是梯度下降法,所以我们封装逻辑回归算法时大部分都可以套用我们之前封装的线性回归梯度下降方法,需要修改的只是损失函数、预测和评分里的一些代码。
|
下面我们在Jupyter Notebook中使用Scikit Learn提供的鸢尾花数据验证我们封装的逻辑回归的方法:
|
因为鸢尾花数据中有三类鸢尾花,而逻辑回归在一开始就讲过是一个解决二分类问题的算法,所以我们只取前两类的鸢尾花数据来验证,并且只用每类鸢尾花的前两个特征,方便绘图:
|
|
可以看到我们封装的逻辑回归算法对鸢尾花的分类是100%准确的,当然也是因为当前的数据比较简单。
END
往期精彩文章回顾
机器学习笔记(十九):逻辑回归
机器学习笔记(十八):模型正则化
机器学习笔记(十七):交叉验证
机器学习笔记(十六):多项式回归、拟合程度、模型泛化
机器学习笔记(十五):人脸识别
机器学习笔记(十四):主成分分析法(PCA)(2)
机器学习笔记(十三):主成分分析法(PCA)
机器学习笔记(十二):随机梯度下降
机器学习笔记(十一):优化梯度公式
机器学习笔记(十):梯度下降
长按扫描二维码关注凌云时刻
每日收获前沿技术与科技洞见
机器学习笔记(二十):逻辑回归(2)相关推荐
- Scikit-Learn 机器学习笔记 -- 线性回归、逻辑回归、softmax回归
Scikit-Learn 机器学习笔记 – 线性回归.逻辑回归.softmax回归 参考文档: handson-ml import numpy as np from matplotlib import ...
- sklearn逻辑回归参数设置_【机器学习笔记】:逻辑回归实战练习(二)
作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 前言 前几篇介绍了逻辑回归在机器学习中的重要性:5个原因告诉你:为什么在成为数据科学家之前,"逻辑回归&q ...
- 机器学习笔记04:逻辑回归(Logistic regression)、分类(Classification)
之前我们已经大概学习了用线性回归(Linear Regression)来解决一些预测问题,详见: 1.<机器学习笔记01:线性回归(Linear Regression)和梯度下降(Gradien ...
- 【机器学习笔记4】逻辑回归模型
目录 什么是逻辑回归? Sigmoid函数 决策边界 逻辑回归的损失函数 为什么平方误差模型不可行? 对数损失函数 单个样例损失: 整体损失函数 梯度下降算法 补充:F1-score评价指标 F1-S ...
- 机器学习笔记I: 基于逻辑回归的分类预测
逻辑回归的介绍 逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中.虽然现在深度学习相 ...
- arctanx麦克劳林公式推导过程_机器学习笔记(七)——初识逻辑回归、不同方法推导梯度公式
一.算法概述 逻辑回归(Logistic)虽带有回归二字,但它却是一个经典的二分类算法,它适合处理一些二分类任务,例如疾病检测.垃圾邮件检测.用户点击率以及上文所涉及的正负情感分析等等. 首先了解一下 ...
- 机器学习笔记(七)——初识逻辑回归、不同方法推导梯度公式
一.算法概述 逻辑回归(Logistic)虽带有回归二字,但它却是一个经典的二分类算法,它适合处理一些二分类任务,例如疾病检测.垃圾邮件检测.用户点击率以及上文所涉及的正负情感分析等等. 首先了解一下 ...
- 机器学习(二)逻辑回归
逻辑回归 原文地址:http://blog.csdn.net/hjimce/article/details/45418933 作者:hjimce 逻辑回归于线性回归的区别: (1)线性回归的函数拟合, ...
- 机器学习笔记——线性回归与逻辑回归
线性回归是什么: 线性回归是回归问题的一种,模型试图去找到y 与 x 的线性关系同时去预测新输入的输出值.模型会找到一条直线使得图像上的每一个点到这条线的欧式距离之和最小,也就是均方误差(MSE)最小 ...
- 机器学习笔记 - 线性回归与逻辑回归
一.线性回归概述 1.概述 线性回归算法是一种预测连续型变量的方法.它的基本思想是通过已给样本点的因变量和自变量的关系,设定一个数学模型,来拟合这些样本点.线性回归算法就是为了找到最佳模型. 线性回归 ...
最新文章
- 【通俗理解线性代数】 -- 内积与相关
- 进阶学习(3.5) Singleton Pattern 单例模式
- boost::function模块boost::lambda::bind用法的测试程序
- 4g网络什么时候淘汰_5G时代,4G将淘汰?4G手机会不会像2g,突然失去网络
- C# 向listbox添加大量数据项的实践心得
- 写java线程导致电脑内存不足_如何写出让java虚拟机发生内存溢出异常OutOfMemoryError的代码...
- Android VNC Server New
- mysql复制的工作原理及主从复制的实现
- 线程的基本状态 java 1615477073
- org.springframework.dao.IncorrectResultSizeDataAccessException: query did not return a unique result
- asp.net core 支付宝支付( 电脑2.0)
- class path resource [spring/] cannot be resolved to URL because it does not exist
- 小学多媒体计算机室管理计划,多媒体教室管理工作计划5篇
- 微信服务号获取地理位置
- 关于vue的@click传递
- html 文字竖排效果
- 机器学习中分类与聚类的本质区别
- softlayer iso_使用SoftLayer创建安全的WordPress博客
- ios开发特殊符号大全:字符+键盘符...
- lg显示器工厂模式怎么进入_LG液晶显示器进入工厂模式方法.概要