scikit-learn 中逻辑斯蒂回归的使用

  • 1 二分类
  • 2 多分类

逻辑斯蒂回归虽然有"回归"两个字,实际上它是一个分类模型,它可以输出属于每一个类别的概率

1 二分类

import numpy as np
from sklearn import datasets
# 加载 sklearn 自带数据
iris = datasets.load_iris()
# 取单一特征
X = iris["data"][:, 3:]  # petal width
# 将target变为两类, 标签为 2 的设置为 1,其它为0
y = (iris["target"] == 2).astype(np.int)  # 引入逻辑回归
from sklearn.linear_model import LogisticRegression
log_reg = LogisticRegression(solver="lbfgs", random_state=42)
log_reg.fit(X, y)# 预测输入
X_new = np.linspace(0, 3, 10).reshape(-1, 1)# 输出分类概率,每一个输入输出k个值,表示每一类概率
y_proba = log_reg.predict_proba(X_new)
print(y_proba )
>>>[[9.99250016e-01 7.49984089e-04][9.96828414e-01 3.17158633e-03][9.86691904e-01 1.33080964e-02][9.45916426e-01 5.40835739e-02][8.04908853e-01 1.95091147e-01][4.93225575e-01 5.06774425e-01][1.86720667e-01 8.13279333e-01][5.13769237e-02 9.48623076e-01][1.26148692e-02 9.87385131e-01][3.00476842e-03 9.96995232e-01]]# 预测分类结果
y = log_reg.predict(X_new)
>>>[0 0 0 0 0 1 1 1 1 1]

2 多分类

import numpy as np
from sklearn.linear_model import LogisticRegression
# 加载 sklearn 自带数据
iris = datasets.load_iris()
# 取两个特征 petal length, petal width
X = iris["data"][:, (2, 3)]
y = iris["target"]softmax_reg = LogisticRegression(multi_class="multinomial",solver="lbfgs", C=10, random_state=42)
softmax_reg.fit(X, y)x0, x1 = np.meshgrid(np.linspace(0, 8, 3).reshape(-1, 1),np.linspace(0, 3.5, 3).reshape(-1, 1))
X_new = np.c_[x0.ravel(), x1.ravel()]y_proba = softmax_reg.predict_proba(X_new)print(y_proba)
>>>[[9.99996239e-01 3.76140758e-06 6.80030712e-20][1.50628731e-03 9.98493250e-01 4.62599964e-07][6.64988192e-13 7.76848864e-02 9.22315114e-01][9.99995653e-01 4.34707831e-06 7.58462461e-15][1.24789116e-03 9.56007603e-01 4.27445060e-02][6.46440282e-18 8.72767038e-07 9.99999127e-01][9.99994975e-01 5.02394057e-06 8.45940105e-10][2.61691633e-07 2.31697741e-04 9.99768041e-01][5.79592787e-23 9.04357657e-12 1.00000000e+00]]
y_predict = softmax_reg.predict(X_new)print(y_predict)
>>>[0 1 2 0 1 2 0 2 2]

参考:Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition

scikit-learn 中逻辑斯蒂回归的使用相关推荐

  1. 一文“妙”解逻辑斯蒂回归(LR)算法

    一.前言 在感知器算法中,如下图 如果我们使用一个f(z)=z函数,作为激励函数,那么该模型即为线性回归.而在逻辑斯蒂回归中,我们将会采用f(z)=sigmoid(z) 函数作为激励函数,所以它被称为 ...

  2. 用二项逻辑斯蒂回归解决二分类问题

    逻辑斯蒂回归: 逻辑斯蒂回归是统计学习中的经典分类方法,属于对数线性模型.logistic回归的因变量可以是二分类的, 也可以是多分类的 基本原理 logistic 分布 折X是连续的随机变量,X服从 ...

  3. 机器学习第八篇:详解逻辑斯蒂回归算法

    01|基本概念: 在介绍逻辑回归模型以前,先介绍一下逻辑斯谛分布. 设X是连续型随机变量,X服从逻辑斯蒂分布是指X具有下列分布函数F(x)和密度函数f(x): 逻辑斯谛分布的分布函数F(x)的曲线如图 ...

  4. 逻辑斯蒂回归_逻辑斯蒂回归详细解析 | 统计学习方法学习笔记 | 数据分析 | 机器学习...

    本文包括: 重要概念 逻辑斯蒂回归和线性回归 二项逻辑斯谛回归模型 逻辑斯蒂回顾与几率 模型参数估计 多项逻辑斯谛回归 其它有关数据分析,机器学习的文章及社群 1.重要概念: 在正式介绍逻辑斯蒂回归模 ...

  5. 【机器学习】逻辑斯蒂回归原理

    逻辑斯蒂函数 引入: 在线性感知器算法中,我们使用了一个f(x)=x函数,作为激励函数,而在逻辑斯蒂回归中,我们将会采用sigmoid函数作为激励函数,所以它被称为sigmoid回归也叫对数几率回归( ...

  6. 【机器学习】逻辑斯蒂回归概率计算和手动计算对比

    二分类,逻辑斯蒂回归概率计算 import numpy as np from sklearn import datasets from sklearn.linear_model import Logi ...

  7. 最大熵阈值python_第六章-逻辑斯蒂回归和最大熵模型

    逻辑斯谛回归是统计学习中的经典分类方法,和最大熵模型相比,具有以下的共同点和区别:共同点都属于概率模型,该模型要寻找的是给定一个x,得到输出变量Y的概率分布P(Y|x),如果是二分类,Y取值为0或1, ...

  8. 学习笔记——逻辑斯蒂回归与最大熵模型

    逻辑斯蒂回归(logistic regression)是统计学习中的经典分类方法.最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型(maximum entropy).都属于对数线性模型 ...

  9. 逻辑斯蒂回归java_机器学习 (五)逻辑斯蒂回归

    一.概念 逻辑斯蒂回归(logistic regression)是统计学习中的经典分类方法,属于对数线性模型.logistic回归的因变量可以是二分类的,也可以是多分类的.logistic回归的因变量 ...

最新文章

  1. 位操作的应用:无参数交换数据,异或加密,循环移位加密【位操作】(56)
  2. 【杂文】Do A Slash
  3. Xcode配置RunScript编译完自动打包ipa
  4. 【AVR ASF4库函数学习笔记】一、使用Microchip Studio图形化配置工程
  5. AI:初学者如何从零学习人工智能?看完你就懂了
  6. [Ansys Workbench] 模型网格划分练习
  7. python表单_python-基于添加表单的Django编辑表单?
  8. eclipse 快捷键
  9. JAVA入门→下载安装编译执行、变量、数据类型
  10. VC++2012编程演练数据结构《36》磁盘文件进行排序
  11. [在Windows上使用Unix工具]MKS
  12. SpringBoot 2.0.0 注入SpingCloud 有bug(目前只有SpringBoot 1.5+ 版本的支持)
  13. DEL: Restore Boxes after VirtualBox Upgrade
  14. 「AI」一文看懂“声纹识别VPR”
  15. 上海车牌拍卖服务器响应时间,上海拍牌技巧:”48秒+700” 最晚出价为55秒
  16. Miracle密码算法开源库(三)分析 :mrarth1.c
  17. 数据分析与挖掘建模(理论知识)
  18. C/C++编程:智能指针
  19. Oracle Data Guard搭建——Physical Standby Database
  20. GNN学习笔记(四):图注意力神经网络(GAT)节点分类任务实现

热门文章

  1. 一家靠收智商税盈利的公司,卖了340亿
  2. 单片机入门led模拟交通灯
  3. root lenovo A690
  4. redis提高oracle性能,redis性能分析与优化建议
  5. 用网络开发新客户,感觉就象是在钓鱼
  6. 哪些简历造假最容易被拆穿?
  7. linux文件系统之 粘住位
  8. vueRouter history模式和hash模式的区别
  9. 使用JS操作CSS实现JS改变背景图片
  10. jquery搜索框效果,搜索,请输入关键字