封面图片:《Python程序设计实验指导书》,董付国编著,清华大学出版社

=================

虽然名字中带有“回归”二字,但实际上逻辑回归是一个用于分类的线性模型,通常也称作最大熵分类或对数线性分类器。在该模型中,描述单个可能输出结果的概率通过一个逻辑函数进行建模。

逻辑回归的因变量既可以是二分类的,也可以是多分类的,但是二分类更常用一些。逻辑回归常用于数据挖掘、疾病自动诊断、经济预测等领域,例如可以挖掘引发疾病的主要因素,或根据这些因素来预测发生疾病的概率。

扩展库sklearn.linear_model中的LogisticRegression类实现了逻辑回归算法,其构造方法语法如下:

__init__(self, penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='liblinear', max_iter=100, multi_class='ovr', verbose=0, warm_start=False, n_jobs=1)

其中,比较常用的参数及含义如下表所示。

表  LogisticRegression类构造方法常用参数及含义

参数名称

含义

penalty

用来指定惩罚时的范数,默认为'l2',也可以为'l1',但求解器'newton-cg'、'sag'和'lbfgs'只支持'l2'

C

用来指定正则化强度的逆,必须为正实数,值越小表示正则化强度越大(这一点和支持向量机类似),默认值为1.0

solver

用来指定优化时使用的算法,该参数可用的值有'newton-cg'、'lbfgs'、'liblinear'、'sag'、'saga',默认值为'liblinear',不同求解器的区别如下:

l 'liblinear'使用坐标下降算法,对于小数据集是个不错的选择,而'sag'、'saga'对于大数据集的速度要快一些

l 对于多分类问题,只有'newton-cg'、'sag'、'saga'和'lbfgs'能够处理多项式损失,而'liblinear'局限于一对多问题(one-versus-rest schemes)

l 'newton-cg'、'sag'和'lbfgs'只支持'l2'正则化或者没有正则化,对于某些高维数据的收敛速度也更快一些,而'liblinear'和'saga'也能处理'l1'惩罚

l 'sag'使用随机平均梯度下降算法,对于样本数量和特征数量都很大的数据集,速度比其他求解器更快一些

multi_class

取值可以为'ovr'或'multinomial',默认值为'ovr'。如果设置为'ovr',对于每个标签拟合二分类问题,否则在整个概率分布中使用多项式损失进行拟合,该参数不适用于'liblinear'求解器

n_jobs

用来指定当参数multi_class='ovr'时使用的CPU核的数量,值为-1时表示使用所有的核

LogisticRegression类对象常用方法如下表所示。

表 LogisticRegression类对象常用方法

方法

功能

fit(self, X, y, sample_weight=None)

根据给定的训练数据对模型进行拟合

predict_log_proba(self, X)

对数概率估计,返回的估计值按分类的标签进行排序

predict_proba(self, X)

概率估计,返回的估计值按分类的标签进行排序

predict(self, X)

预测X中样本所属类的标签

score(self, X, y, sample_weight=None)

返回给定测试数据和标签的平均准确率

densify(self)

把系数矩阵转换为密集数组格式

sparsify(self)

把系数矩阵转换为稀疏格式

下面的代码演示了逻辑回归算法的原理,可以调整其中的参数以便对工作原理有更深入的了解。

代码运行结果为:

代码绘制结果为:

在接下来的例子中,我们根据学生某门课程的复习时长和效率预测期末考试是否能够及格。首先构建逻辑回归模型并使用往年的调查结果数据训练模型,然后对本届学生的复习情况做出预测,并给出特定学习状态时考试及格和不及格的概率。在实际中,复习的越好通过考试的概率越大,但是由于心理素质强弱不同会对临场发挥有所影响,再加上考试题目对知识点的覆盖率也会影响最终成绩,所以复习的好也不能保证百分之百通过考试。

运行结果为:

温馨提示

关注本公众号“Python小屋”,通过菜单“最新资源”==>“历史文章”可以快速查看分专题的800篇技术文章列表(可根据关键字在页面上搜索感兴趣的文章),通过“最新资源”==>“微课专区”可以免费观看300节Python微课,通过“最新资源”==>“培训动态”可以查看近期Python培训安排,通过“最新资源”==>“教学资源”可以查看Python教学资源。

--------董付国老师Python系列图书--------

友情提示:不建议购买太多,最好先通过京东、当当、天猫查阅图书了解目录和侧重点,然后再选择购买适合自己的书。

1)《Python程序设计(第2版)》清华大学出版社,2016年8月

2)《Python可以这样学》清华大学出版社,2017年2月

3)《Python程序设计基础(第2版)》清华大学出版社,2018年1月

4)《中学生可以这样学Python》清华大学出版社,配套微课:《中学生可以这样学Python》84节微课免费观看地址

5)《Python程序设计开发宝典》清华大学出版社,2018年10月

6)《玩转Python轻松过二级》清华大学出版社,2018年5月

7)《Python程序设计基础与应用》机械工业出版社,2018年9月

8)《Python程序设计实验指导书》清华大学出版社,2019年4月

9)《Python编程基础与案例集锦(中学版)》电子工业出版社,2019年4月

10)《大数据的Python基础》机械工业出版社,预计2019年5月出版

11)译作《Python程序设计》,机械工业出版社(华章),2018年11月出版

12)繁体版《Python也可以这样学》,台湾博硕文化股份有限公司,2017年10月出版,本书为《Python可以这样学》在台湾发行的繁体版,两本书内容一样,不建议重复购买。

《中学生可以这样学Python》84节微课免费观看地址

非计算机专业《Python程序设计基础》教学参考大纲

计算机相关专业“Python程序设计”教学大纲(参考)

《Python程序设计》实验指导书(30个实验)

《Python程序设计基础与应用》课后习题答案

Python课程期末考试编程题自动批卷原理与实现模板

“Python小屋”免费资源汇总(截至2018年11月28日)

Python课堂上我与学生斗智斗勇已8个学期

技术要点|Python监控学生端电脑屏幕自动识别学习状态

课后习题答案

《Python程序设计基础(第2版)》习题答案

《Python程序设计基础与应用》课后习题答案

实验指导书

《Python程序设计》实验指导书(30个实验)

Python实验项目1例:使用进程池统计指定范围内素数的个数

教学大纲

非计算机专业《Python程序设计基础》教学参考大纲

计算机相关专业“Python程序设计”教学大纲(参考)

课件

1900页Python系列PPT分享一:基础知识(106页)

1900页Python系列PPT分享二:Python序列(列表、元组、字典、集合)(154页)

1900页Python系列PPT分享三:选择与循环结构语法及案例(96页)

1900页Python系列PPT分享四:字符串与正则表达式(109页)

1900页Python系列PPT分享五:函数设计与应用(134页)

1900页Python系列PPT分享六:面向对象程序设计(86页)

1900页Python系列PPT分享七:文件操作(132页)

1900页Python系列PPT分享八:异常处理结构与程序调试、测试(70页)

2000页Python系列PPT分享九:(GUI编程)(122页)

报告PPT

报告PPT(163页):基于Python语言的课程群建设探讨与实践

报告PPT(123页):Python编程基础精要

(PPT)Python程序设计课程教学内容组织与教学方法实践

Python+sklearn使用逻辑回归算法预测期末考试能否及格相关推荐

  1. python实现逻辑回归算法_逻辑回归算法的实现

    前言 在之前的学习中,我们已经学习了逻辑回归算法的具体数学原理及其简单的推导过程,现在,我们可以用python实现逻辑回归的算法了. 环境 python3.6 jupyter-notebook 绘制数 ...

  2. 【机器学习入门】(9) 逻辑回归算法:原理、精确率、召回率、实例应用(癌症病例预测)附python完整代码和数据集

    各位同学好,今天我和大家分享一下python机器学习中的逻辑回归算法.内容主要有: (1) 算法原理:(2) 精确率和召回率:(3) 实例应用--癌症病例预测. 文末有数据集和python完整代码 1 ...

  3. Python使用逻辑回归算法根据三围数据判断用户性别

    逻辑回归算法是一种经典的分类算法,使用时应注意: 1)样本需要足够多. 2)样本的多个特征之间尽量不要存在线性相关性. 问题描述: 根据三围数据判断用户性别.假设男性和女性的三围和身高的计算公式如下: ...

  4. ML之LoR:基于LoR(逻辑回归)算法对乳腺癌肿瘤(9+1)进行二分类预测(良/恶性)

    ML之LoR:基于LoR(逻辑回归)算法对乳腺癌肿瘤(9+1)进行二分类预测(良/恶性) 目录 输出结果 设计思路 数据集 核心代码 输出结果 Testing accuracy (10 trainin ...

  5. 逻辑回归算法 - 乳腺癌预测

    1 目标 根据历史女性乳腺癌患者数据集(医学指标)构建逻辑回归分类模型进行良/恶性乳腺癌肿瘤预测 2 数据集 2.1 数据集来源 数据集源于威斯康星州临床科学中心.每个记录代表一个乳腺癌的随访数据样本 ...

  6. 算法笔记(11)逻辑回归算法及Python代码实现

    逻辑回归算法是一种被广泛使用的分类算法,通过训练数据中的正负样本,学习样本特征到样本标签之间的假设函数.逻辑回归假设因变量 y 服从伯努利分布,而线性回归假设因变量 y 服从高斯分布. 因此与线性回归 ...

  7. python 逻辑回归,预测银行客户是否购买定期存款

    问题: 逻辑回归其实是一个二分类问题,预测银行客户是否购买定期存款我们会提出以下一些问题: (1)影响银行客户购买定期存款的因素有哪些 (2)对于类别变量我们应该怎样处理, (3)我们应该怎样进行特征 ...

  8. 机器学习算法 03 —— 逻辑回归算法(精确率和召回率、ROC曲线和AUC指标、过采样和欠采样)

    文章目录 系列文章 逻辑回归 1 逻辑回归介绍 1.1 逻辑回归原理 输入 激活函数 1.2 损失以及优化 2 逻辑回归API介绍 3 案例:肿瘤良性恶性预测 4 分类模型的评估 4.1 分类评估方法 ...

  9. 【推荐算法 学习与复现】-- 逻辑回归算法族 -- LR

    协同过滤仅仅使用有限的用户行为信息,逻辑回归算法模型大多引入用户行为.用户特征.物品特征和上下文特征等,从CF逐步过渡到综合不同特征的机器学习模型. (1)逻辑回归模型 将用户特征(年龄.性别等).用 ...

最新文章

  1. POI处理Excel中的日期数据类型
  2. leetcode231
  3. AngularJS快速入门
  4. 【NodeJS 学习笔记04】新闻发布系统
  5. 怎么学python-初学者如何学习Python?掌握这17个实用小技巧快速入门!
  6. Centos7 解决Docker拉取镜像慢的问题
  7. Android版添加phonegap-银联支付插件教程
  8. hive中实现行转列_##[函数]Hive中行列转换(行转列)
  9. 5.8Ghz微波雷达感应技术,智能雷达传感器,人体感应技术方案
  10. 世界十大极限运动是什么
  11. 第一(关于list及dict)
  12. 成功并不是总要劳其筋骨,饿其体肤,成功的密码是: 专注!
  13. 天玑9000和骁龙888plus哪个好
  14. 用js做一个鼠标惯性动画
  15. 华为NE5000E集群路由器荣获InfoVision奖
  16. linux设置sfq队列参数,Linux系统运维之Linux高级流量控制工具TC使用方法
  17. 【Verilog】FPGA驱动WS2812B点阵
  18. 快手+何向南团队最新论文Counterfactual Interactive Recommender System ,反事实推理融入离线强化学习,解决filter bubble/信息茧房问题
  19. openstack安装newton版本keyston部署(一)
  20. 转:eclipse failed to create the java virtual machine 问题图文解析

热门文章

  1. linux mac docky,Ubuntu 7.10中安装酷酷的MAC风格 dock(图)
  2. ideahtml里面没有提示_抖音上爆火的苹果充电提示音,安卓手机也可以设置了!!...
  3. java顺序存储_顺序存储-数据结构-java实现
  4. 面板大小调整_3天学会premiere完全自学教程-更改剪辑大小
  5. python字符串可以使用+进行计算吗_python用正则对字符串进行运算
  6. php100的阶乘代码while语句,编写PHP程序,使用while循环计算4096是2的几次方,然后输出结果...
  7. Android TextView文字横向自动滚动(跑马灯)
  8. android真机调试看不到logcat信息
  9. Runnable Thread分析比较
  10. Mybatis环境部署