python机器学习之门之sklearn的使用(使用鸢尾花数据集)
sklearn全称为scikit learn 专门提供了python机器学习的模块 是一个高效的数据分析算法工具 建议在numpy scipy matplotlib上
对于大多数机器学习 通常有以下四个数据集
1:train_data 训练数据集
2:train_target 训练数据的真是结果集
3:test_data 测试数据集
4:test_target 测试数据对应的真是结果 用来检测预测的正确性
sklearn模块提供了一个强大的数据库 包括鸢尾花 波士顿房价等等 下面用鸢尾花数据集做演示
鸢尾花(iris)数据集 是常用的分类实验数据集 由fisher在1936年收集整理,包含150个数据集 分为三类 每类五十条数据 每条数据包含4个属性。
效果图如下
代码如下
from sklearn.datasets import load_iris
from sklearn.datasets import load_boston
import matplotlib; matplotlib.use('TkAgg')
import pandas as pd
import matplotlib.pyplot as plt
data=load_iris()
print("以下是鸢尾花数据集")data =pd.DataFrame(data=load_iris().data,columns=load_iris().feature_names)#转换为dataframe对象
print(data)
x=data.iloc[:,[0,2]].values
plt.scatter(x[:50,0],x[:50,1],color='red',marker='o',label='setosa')
plt.scatter(x[50:100,0],x[50:100,1],color='blue',marker='x',label='versicolor')
plt.scatter(x[100:,0],x[100:,1],color='green',marker='+',label='Virginica')
plt.xlabel('sepal length')
plt.ylabel('petal length')
plt.legend(loc=2)
plt.show()
觉得有帮助请点赞收藏
python机器学习之门之sklearn的使用(使用鸢尾花数据集)相关推荐
- Python机器学习日记4:监督学习算法的一些样本数据集(持续更新)
Python机器学习日记4:监督学习算法的一些样本数据集 一.书目与章节 二.forge数据集(二分类) 三.blobs数据集(三/多分类) 四.moons数据集 五.wave数据集(回归) 六.威斯 ...
- python机器学习——决策树(分类)及“泰坦尼克号沉船事故”数据集案例操作
决策树(分类)及具体案例操作 一.决策树(分类)算法 (1)算法原理(类似于"分段函数") (2)决策树的变量类型 (3)量化纯度 (4)基本步骤 (5)决策树的优缺点 二.决策树 ...
- 机器学习--python代码实现基于Fisher的线性判别(鸢尾花数据集的分类)
一.线性分类–判断该函数属于哪一类 先上例题,然后我会通过两种方法来判断该函数属于哪一类 1.图解法 定义 对于多类问题:模式有 ω1 ,ω2 , - , ωm 个类别,可分三种情况: 第一种情况:每 ...
- python kfold交叉验证_Python sklearn KFold 生成交叉验证数据集的方法
源起: 1.我要做交叉验证,需要每个训练集和测试集都保持相同的样本分布比例,直接用sklearn提供的KFold并不能满足这个需求. 2.将生成的交叉验证数据集保存成CSV文件,而不是直接用sklea ...
- [python机器学习及实践(2)]Sklearn实现朴素贝叶斯
1.朴素贝叶斯简介 朴素贝叶斯(Naive Bayes)是一个基于贝叶斯理论的分类器.它会单独考量每一唯独特征被分类的条件概率,进而综合这些概率并对其所在的特征向量做出分类预测. 因此,朴素贝叶斯的基 ...
- python kfold交叉验证_Python sklearn KFold 生成交叉验证数据集
源起: 1.我要做交叉验证,需要每个训练集和测试集都保持相同的样本分布比例,直接用sklearn提供的KFold并不能满足这个需求. 2.将生成的交叉验证数据集保存成CSV文件,而不是直接用sklea ...
- 机器学习与深度学习——通过knn算法分类鸢尾花数据集iris求出错误率并进行可视化
什么是knn算法? KNN算法是一种基于实例的机器学习算法,其全称为K-最近邻算法(K-Nearest Neighbors Algorithm).它是一种简单但非常有效的分类和回归算法. 该算法的基本 ...
- Python机器学习基础
1 机器学习的定义 从广义上来说,机器学习是一种可以赋予机器学习的能力以此让它完成直接进行编程无法完成的功能的方法.机器学习也是人工智能的核心,其涉及知识非常广泛,比如概率论,统计学,近似理论,高等数 ...
- python画蝴蝶结_使用鸢尾花数据集,通过Sklearn,绘制精确率-召回率曲线—Python...
Python深度学习的一个小例子,用sklearn自己带的鸢尾花数据集训练. 在导入库的过程中,如果导入from sklearn.model_selection import train_test_s ...
最新文章
- 分享:手把手教你如何免费且光荣地使用正版IntelliJ IDEA
- 设定网页最小最大宽度和高度(兼容IE6)
- 组态王c语言编程实例,组态王命令语言程序.doc
- BZOJ2631: tree
- 如何接地气地接入微前端?
- 数字能查出笔迹吗_大家都知道文字可以做笔迹鉴定,我想问一下专家阿拉伯数字是否也可以做笔迹鉴定正确率高吗?...
- 吉哥系列故事——完美队形II(hdu4513+Manacher)
- 为什么有的安卓手机会越用越卡?
- .NET 基础 一步步 一幕幕 [前言]
- matlab的小波分析,MATLAB小波分析学习.pdf
- appium自动化测试
- 半导体封装测试英语词汇量的软件,半导体英语
- golang的图片操作:缩放图片+合成图片
- Ubuntu18.04关闭休眠(自动休眠与手动休眠)
- Apache JMeter 5.1.1 Win 10 环境变量配置
- NIUSHOP wap端底部导航设置
- 夜神安卓(android)模拟器 摇一摇
- 学习web的多个连接网站地址
- 超火的口红机源码分享
- 去除IntelliJ IDEA中重复代码报灰黄色下划波浪线
热门文章
- PDF怎么转换成PPT?三步教你免费搞定PDF转PPT
- PRIDE PPP-AR II 软件在 Ubuntu 20.04.5 LTS使用随笔
- 【笔记】Echarts 通过自定义图标按钮,动态修改统计图颜色
- concat和+的区别
- python 优化求解器_Python SciPy 优化器(Optimizers)
- 纯java实现连接access数据库详解
- 宜搭低代码与Faas构建数据看板
- 切削技术首页 基础知识 钻镗铣加工 影响平面铣削的要素
- 2020牛客国庆DAY1
- Unity 游戏设计模式 — 中介者模式(Mediator)