45.模型的保存与加载

sklearn模型的保存和加载

from sklearn.externals import joblib

保存和加载API

  • joblib.dump(rf,"")
  • estimator = joblib.load("")

46.逻辑回归定义,损失函数,优化与线性回归比较

逻辑回归

逻辑回归是解决二分类问题的利器

逻辑回归输入:ℎ(w)= w0+w1x1+w2x2+…= w^Tx (单个样本)

sigmoid函数

z是线性回归的结果

47.逻辑回归预测癌症案例

sklearn逻辑回归API

sklearn.linear_model.LogisticRegression(penalty=‘l2’, C = 1.0) 正则化

  • Logistic回归分类器
  • coef_:回归系数

哪一个类别少,判定概率值是指的这个类别(正例)

import pandas as pd
from sklearn.datasets import load_boston
from sklearn.linear_model import  LinearRegression,SGDRegressor,Ridge,LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error,classification_report
import numpy as np
def logistic():#构造列标签column = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion','Single Epithelial Cell Size', 'Bare Nuclei', 'Bland Chromatin', 'Normal Nucleoli', 'Mitoses', 'Class']#读取数据data = pd.read_csv("/Users/zhucan/Desktop/breast-cancer-wisconsin.data",names = column)print(data)#缺失值进行处理data = data.replace(to_replace="?",value=np.nan)data = data.dropna()#进行数据的分割x_train,x_test,y_train,y_test = train_test_split(data[column[1:11]],data[column[10]],test_size=0.25)#进行标准化处理std = StandardScaler()x_train = std.fit_transform(x_train)x_test = std.transform(x_test)#逻辑回归预测lg = LogisticRegression()lg.fit(x_train,y_train)y_predict = lg.predict(x_test)print(lg.coef_)print("准确率:",lg.score(x_test,y_test))print("召回率:",classification_report(y_test,y_predict,labels=[2,4]))return Noneif __name__ == "__main__":logistic()
[[0.57568161 0.27870827 0.3758946  0.34161897 0.26651849 0.637789890.37634213 0.28674634 0.24737593 3.22984025]]
准确率: 1.0
召回率:               precision    recall  f1-score   support2       1.00      1.00      1.00       1104       1.00      1.00      1.00        61accuracy                           1.00       171macro avg       1.00      1.00      1.00       171
weighted avg       1.00      1.00      1.00       171

48.逻辑回归总结

逻辑回归总结

  • 应用:广告点击率预测、电商购物搭配推荐
  • 优点:适合需要得到一个分类概率的场景
  • 缺点:当特征空间很大时,逻辑回归的性能不是很好 (看硬件能力)

机器学习算法基础——逻辑回归相关推荐

  1. 机器学习算法 03 —— 逻辑回归算法(精确率和召回率、ROC曲线和AUC指标、过采样和欠采样)

    文章目录 系列文章 逻辑回归 1 逻辑回归介绍 1.1 逻辑回归原理 输入 激活函数 1.2 损失以及优化 2 逻辑回归API介绍 3 案例:肿瘤良性恶性预测 4 分类模型的评估 4.1 分类评估方法 ...

  2. 机器学习算法之逻辑回归(LR)

    1.前言 说起机器学习,就不得不说说逻辑回归,它是区别于另一个基础算法:线性回归:对于回归(比如线性回归Linear Regression)可以理解为连续的值(类似模拟量),分类(比如逻辑回归Logi ...

  3. 数学推导+纯Python实现机器学习算法:逻辑回归

    2019独角兽企业重金招聘Python工程师标准>>> 自本系列第一讲推出以来,得到了不少同学的反响和赞成,也有同学留言说最好能把数学推导部分写的详细点,笔者只能说尽力,因为打公式实 ...

  4. 【机器学习算法】逻辑回归为什么叫逻辑回归

    文章目录 逻辑回归以及为什么叫逻辑回归 从sigmoid函数引出 逻辑回归的统计学模型:伯努利分布 线性回归模型的通式:广义线性模型 指数族分布 逻辑回归以及为什么叫逻辑回归 逻辑回归虽然名字里有回归 ...

  5. python机器学习手写算法系列——逻辑回归

    从机器学习到逻辑回归 今天,我们只关注机器学习到线性回归这条线上的概念.别的以后再说.为了让大家听懂,我这次也不查维基百科了,直接按照自己的理解用大白话说,可能不是很严谨. 机器学习就是机器可以自己学 ...

  6. 机器学习笔记-基于逻辑回归的分类预测

    天池学习笔记:AI训练营机器学习-阿里云天池 基于逻辑回归的分类预测 1 逻辑回归的介绍和应用 1.1 逻辑回归的介绍 逻辑回归(Logistic regression,简称LR)虽然其中带有&quo ...

  7. 推荐算法之逻辑回归模型族

    目录 1.协同过滤算法族的不足 2.逻辑回归算法 3.Poly2算法 4.FM算法 5.FFM 1.协同过滤算法族的不足 之前的协同过滤算法族局限在于,它仅仅关注用户与物品的交互信息(受限于共现矩阵) ...

  8. 朴素贝叶斯算法和逻辑回归算法的区别?

    朴素贝叶斯算法和逻辑回归算法的区别? 1.两种算法的模型不同: Naive Bayes是一个生成模型,在计算P(y|x)之前,先要从训练数据中计算P(x|y)和P(y)的概率,从而利用贝叶斯公式计算P ...

  9. sklearn分类器算法:逻辑回归及案例分析

    分类算法之逻辑回归 逻辑回归(Logistic Regression),简称LR.它的特点是能够是我们的特征输入集合转化为0和1这两类的概率.一般来说,回归不用在分类问题上,因为回归是连续型模型,而且 ...

最新文章

  1. 一篇文章搞懂人脸识别的十个概念
  2. 剖析Hadoop和Spark的Shuffle过程差异(一)
  3. 7.1 定义关键指标KPI
  4. html编码自动识别,vi设置自动识别各种编码
  5. 韩顺平mysql优化笔记_韩顺平 mysql优化笔记.doc
  6. 解决element-ui的el-select组件文字超过宽度时不出现横向滚动条问题
  7. 【Python】django安装
  8. 三菱伺服自动调谐_三菱伺服mr-j3与mr-j4参数有什么差别
  9. 使用Kubuntu运行命令对话框(Alt + F2)
  10. 信息安全实验四:RSA公钥加密算法 2019.04.28
  11. net-java-php-python-篮球新闻网站计算机毕业设计程序
  12. Mysql 5.7 表名大写遇到的坑 error: 1146: Table 'your_table' doesn't exist
  13. 基于java的银行信用卡业务系统
  14. matlab数学建模-神经网络经典应用:逼近非线性函数
  15. ZZULIOJ:1071: 分解质因子
  16. Translation Regime介绍
  17. python学习笔记(持续更新)
  18. 会员系统_健身房管理系统
  19. SIGIR 2021 | FSCD-PreRank:面向效率和效果更加均衡的交互式粗排模型
  20. CTF writeup:实验吧,天下武功唯快不破

热门文章

  1. 集合竞价如何买入_集合竞价的那些事:开盘涨停,这样做你也能抢到!
  2. extjs 计算日期之和_财报分析之利润表的重构(2)——以医药制造行业为例
  3. 常见的物联网通信协议
  4. C++中的虚函数与纯虚函数
  5. 华为 鸿蒙只是物联网,“鸿蒙”不只是手机系统,任正非:是为物联网所打造的系统...
  6. 马云谈计算机技术发展趋势,马云谈创业:靠的不是技术而是观念
  7. LeanCloud数据更新不同步问题
  8. PyTorch模块类
  9. 文巾解题 231. 2的幂
  10. 字节跳动ClickHouse在用户增长分析场景的应用