LogisticRegression中文叫做逻辑回归,是一种基础、常用的分类方法。

2018年8月24日笔记

1.数据集

Iris(鸢尾花)数据集是多重变量分析的数据集。

数据集包含150行数据,分为3类,每类50行数据。

每行数据包括4个属性:Sepal Length(花萼长度)、Sepal Width(花萼宽度)、Petal Length(花瓣长度)、Petal Width(花瓣宽度)。可通过这4个属性预测鸢尾花属于3个种类的哪一类。

样本数据局部截图:

Iris.png

获取150个样本数据的3种方法:

1.完整的样本数据Iris.csv文件下载链接: https://pan.baidu.com/s/16N0ivGWFrmc73ustPLWPZA 密码: ugun

2.数据集链接:https://gist.github.com/curran/a08a1080b88344b0c8a7

3.在sklearn的skleanrn库中自带了iris数据集,可以导入sklearn库的datasets文件,调用datasets文件中的load_iris方法就可以获得iris数据集。

本文采用的是第3种方法,直接从sklearn库中获取数据。

2.观察数据

image.png

查看数据集对象的属性和方法,代码如下:

from sklearn.datasets import load_iris

dir(load_iris())

上面一段代码的运行结果如下:

['DESCR', 'data', 'feature_names', 'target', 'target_names']

查看数据集的描述,即打印数据集对象的DESCR属性,代码如下:

from sklearn.datasets import load_iris

print(load_iris().DESCR)

与上图中文文档的图对照阅读,可以加强对数据集的理解。

上面一段代码的运行结果如下图所示:

image.png

将150个样本4个特征组成的矩阵赋值给变量X,变量X为大写字母的原因是数学中表示矩阵使用大写字母。

将150个样本1个预测目标值组成的矩阵赋值给变量y。

载入数据集的代码如下:

from sklearn.datasets import load_iris

X = load_iris().data

y = load_iris().target

3.逻辑回归模型

利用交叉验证方法得出模型得分。

代码如下:

from sklearn.linear_model import LogisticRegression

from sklearn.model_selection import cross_val_score

from sklearn.model_selection import ShuffleSplit

logisticRegression_model = LogisticRegression()

cv_split = ShuffleSplit(n_splits=5, train_size=0.7, test_size=0.2)

score_ndarray = cross_val_score(logisticRegression_model, X, y, cv=cv_split)

print(score_ndarray)

score_ndarray.mean()

上面一段代码的运行结果如下图所示:

交叉验证.png

c语言鸢尾花智能分类,基于LogisticRegression的鸢尾花分类相关推荐

  1. NLP(新闻文本分类)——基于机器学习的文本分类

    文本表示方法 在机器学习算法的训练过程中,假设给定NNN个样本,每个样本有MMM个特征,这样组成了N×MN×MN×M的样本矩阵,然后完成算法的训练和预测.同样的在计算机视觉中可以将图片的像素看作特征, ...

  2. matlab的稀疏表示分类,基于稀疏表示的分类方法

    四天数模,做得不好,但收获不小.最后还通宵一宿,多日后得以重获新生,特做个小记,聊记心得. 本次选题为神经元的分类和聚类,前者给定种类,需要通过训练样本找寻分类特征,再用测试样本测试分类方法的正确性. ...

  3. 如何用c语言编写智能照明系统,基于STC89C52单片机的智能照明控制系统方案设计...

    目前我国高校的教学楼和学生宿舍的照明系统大多采用定时方式控制,存在电能的大量浪费和照明模式不灵活等问题.本文基于51单片机,通过设置时间.感应光照与声音,针对教学楼和宿舍的不同需求设定照明状态,实现对 ...

  4. R语言使用yardstick包的conf_mat函数计算多分类(Multiclass)模型的混淆矩阵、并使用summary函数基于混淆矩阵输出分类模型评估的其它详细指标(kappa、npv等13个)

    R语言使用yardstick包的conf_mat函数计算多分类(Multiclass)模型的混淆矩阵(confusion matrix).并使用summary函数基于混淆矩阵输出分类模型评估的其它详细 ...

  5. 基于Adaboost实现鸢尾花数据集分类

    写在之前 提交内容分为两大部分: 一为Adaboost算法实现,代码在文件夹<算法实现>中,<提升方法笔记>为个人学习笔记. 二为基于Adaboost模型实现鸢尾花数据集分类, ...

  6. 基于python的智能安防系统_基于Python语言的智能家居系统研究

    龙源期刊网 http://www.qikan.com.cn 基于 Python 语言的智能家居系统研究 作者:张微微

  7. c语言开发五轴后处理,「数控干货」基于UG CLS文件使用 C 语言制作智能后处理工具...

    原标题:「数控干货」基于UG CLS文件使用 C 语言制作智能后处理工具 1 前言 UG 后处理操作是 UGCAM 数控加工工作中一个重要环节,主要任务是把在 UG 加工环境下生成的加工刀位文件转换成 ...

  8. c语言开发五轴后处理,基于UGCLS文件使用C语言制作智能后处理工具.doc

    基于UGCLS文件使用C语言制作智能后处理工具 基于UG CLS文件使用C语言制作智能后处理工具 发表时间:2008-9-10 张伟 基于UGCLS文件特性,利用C语言制作附带业务规则的后处理工具的一 ...

  9. 《MATLAB智能算法30个案例》:第28章 支持向量机的分类——基于乳腺组织电阻抗特性的乳腺癌诊断

    <MATLAB智能算法30个案例>:第28章 支持向量机的分类--基于乳腺组织电阻抗特性的乳腺癌诊断 1. 前言 2. MATLAB 仿真示例 3. 小结 1. 前言 <MATLAB ...

最新文章

  1. 76项!海南省崖州湾种子实验室揭榜挂帅项目立项结果公示
  2. 解决win10安装MySQL数据库出现服务无法启动的问题
  3. Youtube推荐系统是如何挖掘用户内心另一面的
  4. 全球与中国PTFE涂层玻璃布市场供给趋势及十四五投资规划研究报告2021年版
  5. LogViewer超大文本浏览工具
  6. linux mysql 主从数据库_linux mysql数据库的主从配置
  7. SpringBoot------Servlet3.0的注解自定义原生Listener监听器
  8. puppet kick 功能实现
  9. Vue源码解析之数组变异
  10. php说明代码怎么写,代码怎么写 - 起步 - PHP基础 - KK的小故事
  11. Winform datagridview相关操作
  12. svn 地址中文_iGit自助迁移SVN工程解密
  13. LINUX SHELL使用while循环数组
  14. pie函数--Matplotlib
  15. 解决eclipse反编译乱码
  16. 鸿蒙不支持PDF,华为鸿蒙 HarmonyOS IoT 应用设计文档(1).pdf
  17. Xilinx Srio详解IP核使用
  18. CATIA模型导入3dsMax形成三层关系的问题
  19. three.js 05-01 之 PlaneGeometry 几何体
  20. 视频会议实现方式有哪些

热门文章

  1. 微信计步器怎么不计步_送我一顶圣诞帽@星尘StarDust,制作一个圣诞创意微信头像...
  2. Vue图片上传删除预览操作
  3. flex的三个属性grow、shrink、basis
  4. aes解密设置utf8 php,PHP aes (ecb)解密后乱码问题
  5. Linux 开发中的常用命令 ( Cygwin 环境也同样适用)
  6. ubuntu16.04安装python.h_ubuntu16.04安装python3.6踩过的坑
  7. Kubernetes 配置私有镜像仓库时,没有权限访问的问题
  8. mysql数据库任务驱动式教程课后答案_MySQL数据库任务驱动式教程
  9. 系统服务器地云盘上,系统服务器地云盘上
  10. java类功能的模块化电源_Java9模块化指南