Logistic 损失函数

1.Logistic函数 & Logistic回归

Logistic函数的定义:

P(x)=11+exp(−x)(1)

P(x)=\frac{1}{1+\exp(-x)} \tag{1}
其中 x∈ℝx \in \mathbb{R}, P(x)∈ℝP(x) \in \mathbb{R}。Logistic函数的一个重要的特点:

P(−x)=1−P(x)(2)

P(-x)=1-P(x) \tag{2}

Logistic函数常用语Logistic回归:

P(y=1∣βx)=exp(βTx)1+exp(βTx)

P(y=1\mid\boldsymbol{\beta}\boldsymbol{x})=\frac{\exp(\boldsymbol{\beta}^T\boldsymbol{x})}{1+\exp(\boldsymbol{\beta}^T\boldsymbol{x})}

P(y=0∣β,x)=11+exp(βTx)(3)

P(y=0\mid\boldsymbol{\beta},\boldsymbol{x})=\frac{1}{1+\exp(\boldsymbol{\beta}^T\boldsymbol{x})} \tag{3}

其中xx是特征向量β\beta是系数向量。根据公式(2),可以得到:

P(y=1∣βx)=1−P(y=0∣β,x)(4)

P(y=1\mid\boldsymbol{\beta}\boldsymbol{x})=1-P(y=0\mid\boldsymbol{\beta},\boldsymbol{x}) \tag{4}

在Logistics回归中,标签y∈{0,1}y\in\{0,1\}。式子(3)用两个表达式来建模,也能够用一个表达式来建模:

P(g=±1∣β,x)=11+exp(−gβTx)(5)

P(g=\pm1\mid\boldsymbol{\beta},\boldsymbol{x})=\frac{1}{1+\exp(-g\boldsymbol{\beta}^T\boldsymbol{x})}\tag{5}
其中 g∈±1g\in{\pm1}是样本点 xx的标签。很容易证明P(g=1∣β,x)=1−P(g=−1∣β,x)P(g=1\mid\boldsymbol{\beta},\boldsymbol{x})=1-P(g=-1\mid\boldsymbol{\beta},\boldsymbol{x})

2. 两种Logistic回归形式的等价性

上述式(3)和(5)描述了Logistics回归的两种形式,这一节证明两中形式是等价的:

P(y=1∣β,x)=exp(βTx)1+exp(βTx)=11exp(βTx)+1=1exp(−βTx)+1=P(g=1∣β,x)

\begin{align} P(y=1\mid\boldsymbol{\beta},\boldsymbol{x}) &=\frac{\exp(\boldsymbol{\beta}^T\boldsymbol{x})}{1+\exp(\boldsymbol{\beta}^T\boldsymbol{x})} \\ &=\frac{1}{\frac{1}{\exp(\boldsymbol{\beta}^T\boldsymbol{x})}+1} \\ &=\frac{1}{\exp(-\boldsymbol{\beta}^T\boldsymbol{x})+1} \\ &=P(g=1\mid\boldsymbol{\beta},\boldsymbol{x}) \end{align}
从分类机制证明(3),类标签为1的概率大于类标签为0的概率:

exp(βTx)1+exp(βTx)11+exp(βTx)exp(βTx)βTx>1→y=1>1>0

\begin{align} \dfrac{\frac{\exp(\boldsymbol{\beta}^T\boldsymbol{x})}{1+\exp(\boldsymbol{\beta}^T\boldsymbol{x})}}{\frac{1}{1+\exp(\boldsymbol{\beta}^T\boldsymbol{x})}}&>1 \to y=1 \\ \exp(\boldsymbol{\beta}^T\boldsymbol{x})&>1 \\ \boldsymbol{\beta}^T\boldsymbol{x} &>0 \end{align}
从分类机制证明(5),类标签为1的概率大于类标签为-1的概率:

11+exp(−βTx)11+exp(βTx)1+exp(βTx)1+exp(−βTx)exp(βTx)βTx>1→g=1>1>1>0

\begin{align} \dfrac{\frac{1}{1+\exp(-\boldsymbol{\beta}^T\boldsymbol{x})}}{\frac{1}{1+\exp(\boldsymbol{\beta}^T\boldsymbol{x})}} &>1\to g=1 \\ \dfrac{1+\exp(\boldsymbol{\beta}^T\boldsymbol{x})}{1+\exp(-\boldsymbol{\beta}^T\boldsymbol{x})}&>1\\ \exp(\boldsymbol{\beta}^T\boldsymbol{x})&>1\\ \boldsymbol{\beta}^T\boldsymbol{x}&>0 \end{align}

3. Logistic损失

描述Logistics回归的优化形式:

argmin∑iL(yi,f(xi))

\arg\min\sum_{i}L(y_i,f(\boldsymbol{x}_i))
其中 ff是一个假想函数(hypothesis function),LL是损失函数。对于Logistic回归:

f(x)L(y,f(x))=βTx=log(1+exp(−yf(x)))

\begin{align} f(\boldsymbol{x})&=\boldsymbol{\beta}^T\boldsymbol{x} \\ L(y,f(\boldsymbol{x}))&=\log(1+\exp(-yf(\boldsymbol{x}))) \end{align}
其中 y∈{±1}y\in\{\pm1\}。

Logistic 损失函数相关推荐

  1. 2.18 Logistic 损失函数的解释-深度学习-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.17 Jupyter/iPython 笔记本的快速指南 回到目录 2.19 总结习题 Logistic 损失函数的解释 ( Explanation of Logistic ...

  2. 什么影响matlab损失值,matlab – 在计算Logistic损失函数的值和梯度时避免数值溢出...

    我目前正在尝试在MATLAB中实现涉及 logistic loss function的机器学习算法.不幸的是,由于数字溢出,我遇到了一些麻烦. 通常,对于给定的输入s,逻辑函数的值为: log(1 + ...

  3. logistic 损失函数的解释

  4. 2.18 logistic 损失函数的解释

  5. 边框回归的损失函数_一文搞懂常用的七种损失函数

    主要内容: 0-1, Hinge, Logistic, Cross Entropy, Square, Absolute, Huber 简述: 损失函数刻画了模型与训练样本的匹配程度. 分类损失 分类L ...

  6. logistic回归--好文

    1.logistic回归的应用场景 Logistic回归是一种用于解决二分类问题的机器学习方法,是一种判别模型:表现为直接对条件概率P(y|x)建模,而不关心背后的数据分布P(x,y) 用于估计某种事 ...

  7. [机器学习] XGBoost 自定义损失函数-FocalLoss

    一.XGBoost损失函数 损失函数:损失函数描述了预测值和真实标签的差异,通过对损失函数的优化来获得对学习任务的一个近似求解方法 boosting类算法的损失函数的作用: Boosting的框架, ...

  8. 逻辑回归损失函数通常是凸函数(附平方差损失的非凸证明以及交叉熵损失函数求导)

    Q:为什么逻辑回归损失函数往往要求是凸函数?(此处凸函数是指下凸,国内和国外凸函数的标准不一样,是相反的,吴恩达的机器学习课程凸函数是指下凸) A:如果损失函数是非凸的,使用梯度下降法优化时,最后得到 ...

  9. Logistic回归模型和惩罚模型

    Logistic回归模型 主题思想 是一个分类模型,通过对数据的分类边界线建立回归公式,从而实现分类. 激活函数 将连续的数值转化成0或1的输出. Heaviside函数(阶梯跳跃函数): 0到1的跳 ...

最新文章

  1. vue+mint-ui地址三级or四级联动
  2. 数据库错误 ERROR 1366 (HY000): Incorrect string value: ‘\xD4\xF8\xBB\xAA‘ for column ‘Sname‘ at row 1解决
  3. Spring mvc配置文件
  4. Exchange 2010 SP2 新功能
  5. 编译内核是几个常用的命令备忘
  6. 安卓IOS 手机添加O365 邮箱账户
  7. 怎么装办公系统服务器,怎么安装oa系统教程
  8. 数据可视化案例(七)——智慧园区
  9. 软考高项 : (04)论项目沟通管理
  10. Feed流及其常见算法简介
  11. 中国工程咨询行业十四五投资机会与运营风险评估报告2022-2028年
  12. PADS中常用无模命令快捷键
  13. OpenCV与图像算法笔记
  14. lol7月9日服务器维护,英雄联盟7月9日更新维护到几点结束_lol7月9日10.14版本更新维护结束时间介绍_咖绿茵手游站...
  15. Python矩阵计算-Numpy
  16. 高智商与低智商的区别_体内平衡与智力的定义
  17. jquery.fn jquery.extend jquery.fn.extend
  18. 百度AI战疫五十天:三场战役与一次胜利
  19. 【编译原理】LR语法分析器的设计与实现
  20. 《Linux内核修炼之道》精华分享与讨论(7)——分析内核源码如何入手?(下)

热门文章

  1. printf函数详细解析
  2. 多项式乘法与快速傅里叶变换
  3. 旋度定理(Curl Theorem)和散度定理(Divergence theorem)
  4. vue数据可视化组件
  5. c# 基本值类型及其默认值
  6. Python躺赚大法,月入一个苹果不在话下!
  7. 基础TypeScript(一)
  8. 水文自学计算机单片技术,水文仪器工作基础学习知识原理.doc
  9. 区块链专家与媒体面对面 | “区块链让数据产生价值”
  10. jpa整合sqlLite