文章目录

  • 一、环境
  • 二、具体实现步骤
    • 第1步:数据预处理
      • 导入库
      • 导入数据
      • 将数据集分成训练集和测试集
    • 第2步:逻辑回归模型
    • 第3步:预测结果
    • 第4步:评估预测结果
      • 可视化
  • 三、可视化结果展示
  • 四、逻辑回归是什么
  • 五、利用matplotlib实现可视化
    • 1. 函数讲解
    • 2. 关于X_set[y_set==j,0]

一、环境

  • Python3.6.5
  • 编译器:jupyter notebook

二、具体实现步骤

第1步:数据预处理

导入库

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

导入数据

dataset = pd.read_csv('Social_Network_Ads.csv')
X = dataset.iloc[ : , [2,3]].values
Y = dataset.iloc[ : ,4].values

将数据集分成训练集和测试集

from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.25, random_state=0)

第2步:逻辑回归模型

from sklearn.linear_model import LogisticRegression
classifier = LogisticRegression()
classifier.fit(X_train, Y_train)

第3步:预测结果

Y_pred = classifier.predict(X_test)

第4步:评估预测结果

可视化

from matplotlib.colors import ListedColormap
#1.训练集可视化
X_set,y_set=X_train,Y_trainx = np.arange(start=X_set[:,0].min()-1, stop=X_set[:, 0].max()+1, step=0.01)
y = np.arange(start=X_set[:,1].min()-1, stop=X_set[:,1].max()+1, step=0.01)
#把x,y绑定为网格的形式
X1,X2=np. meshgrid(x,y)plt.contourf(X1, X2, classifier.predict(np.array([X1.ravel(),X2.ravel()]).T).reshape(X1.shape),alpha = 0.75, cmap = ListedColormap(('red', 'green')))
plt.xlim(X1.min(),X1.max())
plt.ylim(X2.min(),X2.max())
for i,j in enumerate(np.unique(y_set)):plt.scatter(X_set[y_set==j,0],X_set[y_set==j,1],c = ListedColormap(('red', 'green'))(i), label=j)plt. title(' LOGISTIC(Training set)')
plt. xlabel(' Age')
plt. ylabel(' Estimated Salary')
plt. legend()
plt. show()#2.测试集可视化
X_set,y_set=X_test,Y_testx = np.arange(start=X_set[:,0].min()-1, stop=X_set[:, 0].max()+1, step=0.01)
y = np.arange(start=X_set[:,1].min()-1, stop=X_set[:,1].max()+1, step=0.01)
#把x,y绑定为网格的形式
X1,X2=np. meshgrid(x,y)plt.contourf(X1, X2, classifier.predict(np.array([X1.ravel(),X2.ravel()]).T).reshape(X1.shape),alpha = 0.75, cmap = ListedColormap(('red', 'green')))
plt.xlim(X1.min(),X1.max())
plt.ylim(X2.min(),X2.max())
for i,j in enumerate(np.unique(y_set)):plt.scatter(X_set[y_set==j,0],X_set[y_set==j,1],c = ListedColormap(('red', 'green'))(i), label=j)plt. title(' LOGISTIC(Test set)')
plt. xlabel(' Age')
plt. ylabel(' Estimated Salary')
plt. legend()
plt. show()

三、可视化结果展示

四、逻辑回归是什么

简单来说, 逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。

逻辑回归是为了解决分类问题,根据一些已知的训练集训练好模型,再对新的数据进行预测属于哪个类。

逻辑回归(Logistic Regression)与线性回归(Linear Regression)都是一种广义线性模型(generalized linear model)。逻辑回归假设因变量 y 服从伯努利分布,而线性回归假设因变量 y 服从高斯分布。(这部分暂时了解了即可)

这篇博客简单介绍一下逻辑回归是个什么东西,下一篇博客将展开对逻辑回归的具体介绍。

五、利用matplotlib实现可视化

1. 函数讲解

(1) np.arange(): arange([start,] stop[, step,], dtype=None)根据start与stop指定的范围以及step设定的步长,生成一个 ndarray可迭代对象。

(2) .ravel(): 将多维数组降为一维数组。

(3) .reshape(): A.reshape(X1.shape)将A的类型重塑为X1的shape。

(4) T: 实现数组转置和轴对换。例如:

arr = np.arange(15).reshape(3,5)
"""
输出:
array([[ 0,  1,  2,  3,  4],[ 5,  6,  7,  8,  9],[10, 11, 12, 13, 14]])
"""
arr.T
"""
输出:
array([[ 0,  5, 10],[ 1,  6, 11],[ 2,  7, 12],[ 3,  8, 13],[ 4,  9, 14]])
"""

(5).meshgrid(): meshgrid函数用两个坐标轴上的点在平面上画网格。

(6).contourf(): 用来画红绿两种结果的分界线, classifier.predict(np.array([X1.ravel(),X2.ravel()]).T).reshape(X1.shape),这个是利用逻辑回归模型预测分界线。

(7)xlim: plt.xlim设置x坐标轴范围。

(8)ylim: plt.ylim设置y坐标轴范围。

(9)unque(): 是一个去重函数。

(10)enumerate: 用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。

今天先了解一下利用matplotlib实现可视化,明天将对matplotlib进行详细介绍。

2. 关于X_set[y_set==j,0]

for i,j in enumerate(np.unique(y_set)):plt.scatter(X_set[y_set==j,0],X_set[y_set==j,1],c = ListedColormap(('red', 'green'))(i), label=j)

关于这个点小编也是半懂,简单谈一下我的理解。y_set == j的结果是一个布尔值这个是肯定的,当y_set == j的结果为False时,plt.scatter语句不执行;当y_set == j的结果为True时,plt.scatter语句执行,X_set[y_set==j,0]的作用效果相当于X_set[ : ,0]。

附上老外的看法:What does X_set[y_set == j, 0] mean?

有不同见解的童鞋可以在下方留言,我们一起交流。

机器学习第5天:逻辑回归相关推荐

  1. 机器学习系列(1)_逻辑回归初步

    转载自: 机器学习系列(1)_逻辑回归初步 - 寒小阳 - 博客频道 - CSDN.NET http://blog.csdn.net/han_xiaoyang/article/details/4912 ...

  2. Coursera公开课笔记: 斯坦福大学机器学习第六课“逻辑回归(Logistic Regression)”

    Coursera公开课笔记: 斯坦福大学机器学习第六课"逻辑回归(Logistic Regression)" 斯坦福大学机器学习第六课"逻辑回归"学习笔记,本次 ...

  3. Scikit-Learn 机器学习笔记 -- 线性回归、逻辑回归、softmax回归

    Scikit-Learn 机器学习笔记 – 线性回归.逻辑回归.softmax回归 参考文档: handson-ml import numpy as np from matplotlib import ...

  4. 斯坦福大学机器学习第四课“逻辑回归(Logistic Regression)”

    斯坦福大学机器学习第四课"逻辑回归(Logistic Regression)" 本次课程主要包括7部分: 1) Classification(分类) 2) Hypothesis R ...

  5. 【机器学习】Logistic Regression逻辑回归原理与java实现

    [机器学习]Logistic Regression逻辑回归原理与java实现 1.基于概率的机器学习算法 2.逻辑回归算法原理 2.1.分离超平面 2.2.阈值函数 2.3.样本概率 2.4.损失函数 ...

  6. 机器学习02-分类、逻辑回归

    目录 一.分类问题 Classification 二.分类问题的估值 Hypothesis Representation 三.分类问题的决策边界 Decision Boundary 四.分类问题的代价 ...

  7. 机器学习基础专题:逻辑回归

    逻辑回归 广义线性模型. 原理 输入 训练集数据T=(x1,y1)...(xM,yM)T = {(x_1,y_1) ... (x_M,y_M)}T=(x1​,y1​)...(xM​,yM​),xi∈X ...

  8. 逻辑回归python sigmoid(z)_python实现吴恩达机器学习练习2(逻辑回归)-data1

    python实现吴恩达机器学习练习2(逻辑回归)-data1 这篇是第一个数据集:这部分练习中,你将建立一个预测学生是否被大学录取的逻辑回归模型. 假如一所大学会每个报名学生进行两项入学考试,根据两项 ...

  9. [机器学习] Coursera ML笔记 - 逻辑回归(Logistic Regression)

    引言 机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归.逻辑回归.Softmax回归.神经网络和SVM等等.主要学习资料来自Standford Andrew N ...

  10. 【Python学习系列十三】Python机器学习库scikit-learn实现逻辑回归

    逻辑回归基础知识可参考:http://blog.csdn.net/fjssharpsword/article/details/54580552 python内部算法已经实现了,最重要是理解y=f(x) ...

最新文章

  1. python语言属于-python属于哪种语言
  2. .NET MVC对接POLYV——HTML5播放器播放加密视频
  3. C++函数模板(二)引用
  4. jsr303jsp页面怎么显示错误信息_jsp校验信息不显示
  5. 改革开放成就我 感谢祖国
  6. CVPR 2020 论文大盘点—目标跟踪篇
  7. Android学习小Demo(10)ToDoList的加强版
  8. 【CSS3】纯CSS代码实现模拟时钟,+js对时功能。
  9. linux VIM 命令详解
  10. png格式图像转成jpg图像时出现异常颜色值
  11. Ubuntu18.04 显卡驱动安装(GTX1060)正确步骤
  12. [单片机框架][bsp层][AT32F415][bsp_tim] tim定时器配置和使用
  13. 项目经理的工具箱---走出软件作坊:三五个人十来条枪 如何成为开发正规军(三)...
  14. 不是私密链接,如何继续前往?
  15. 面向对象开发期末复习概述(六)
  16. hdu2822(会双搜后再写次)
  17. js网页繁体简体转换(备忘)
  18. 搭建自己的BT下载平台服务器
  19. 关于IIC中的SDA SCL输入输出模式
  20. 【BZOJ1033】[ZJOI2008]杀蚂蚁antbuster【模拟】

热门文章

  1. sendto 返回errnor 1,错误码1 Operation not permitted
  2. java 判断 年份,java怎么判断指定年份是否是闰年
  3. nexus5 刷原装android,nexus5 刷回原生系统
  4. python收取wss数据_Python金融应用之提取交易日+合并截面数据
  5. 配置oracle 11g环境,oracle 11g 的安装环境的配置
  6. 服务器忘记linux系统密码,linux系统服务器忘记密码怎么办
  7. Qt中的TCP客户端编程
  8. tensowflow 训练 远程提交_一文说清楚Tensorflow分布式训练必备知识
  9. html 一行显示边框线,HTML 网页中要显示出来一个虚线的边框 就是一行字在边框里面,那个边框是显示出来的,程式码应该怎么写?...
  10. 3种团队分组适应项目_暴利生意:3种适合农村夫妻创业致富的项目,年赚10多万...