机器学习(1)机器学习基础 鸢尾花数据集
目录
一、机器学习基础理论
1、机器学习过程
2、机器学习分类
3、数据集返回值介绍
二、鸢尾花数据集(实战)
1、首先是获取数据集
2、显示数据集信息(可以不要)
三、数据集划分
1、数据集划分API
2、代码及效果
总代码
一、机器学习基础理论
1、机器学习过程
- 获取数据
- 数据处理
- 特征工程(特征值、目标值)(包括标准化)
- 算法训练 -> 得到模型
- 模型评估
2、机器学习分类(有监督/无监督)
学习阶段可用数据集:
sklearn、kaggle、UCI
3、数据集返回值介绍
load返回小数据集,fetch返回大数据集。
返回datasets.base.Bunch数据类型(字典格式)
标签(target):目标值
特征(data):特征值
返回方式1:dict['key']
返回方式2:dict.key
二、鸢尾花数据集(实战)
以上三种鸢尾花,分别为鸢尾花的三个标签。
1、首先是获取数据集
# 获取数据集(鸢尾花)iris = load_iris()
2、显示数据集信息(可以不要)
# 显示数据集信息Show_Data()# 显示数据集
def Show_Data():# 鸢尾花数据集print('鸢尾花数据集\n\n', iris)# print('鸢尾花数据集描述\n', iris['DESCR'])# 鸢尾花标签# print('鸢尾花标签名称\n', iris.target_names)# print('鸢尾花标签数组\n', iris.target)# 鸢尾花特征值# print('鸢尾花特征值名称\n', iris.feature_names)# print('鸢尾花特征值\n', iris.data)# 数组行、列查看# print('鸢尾花特征数组行列\n', iris.data.shape)# print('鸢尾花标签数组行列\n', iris.target.shape)
三、数据集划分
为了给后面的模型评估留下数据,这里只能选取一部分数据进行模型训练。
1、数据集划分API
sklearn.model_selection.train_test_split
返回:训练集特征值、测试集特征值、训练集目标值、测试集目标值。
2、代码及效果
# 数据集划分
def Data_Split():# 训练集、测试集划分APItrain_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target, test_size=0.2)#训练集特征值 测试集特征值 训练集目标值 测试集目标值 训练集测试集划分API 训练集 测试集 测试量# 显示(训练集/测试集的特征值/目标值)print('训练集特征值:', train_data.shape)print('测试集特征值:', test_data.shape)print('训练集目标值:', train_target.shape)print('测试集目标值:', test_target.shape)
总代码
# 机器学习基础(鸢尾花数据集)
# sklearn.model_selection.train_test_split返回:
# 训练集特征值、测试集特征值、训练集目标值、测试集目标值。
import cv2
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split# 显示数据集
def Show_Data():# 鸢尾花数据集print('鸢尾花数据集\n\n', iris)# print('鸢尾花数据集描述\n', iris['DESCR'])# 鸢尾花标签# print('鸢尾花标签名称\n', iris.target_names)# print('鸢尾花标签数组\n', iris.target)# 鸢尾花特征值# print('鸢尾花特征值名称\n', iris.feature_names)# print('鸢尾花特征值\n', iris.data)# 数组行、列查看# print('鸢尾花特征数组行列\n', iris.data.shape)# print('鸢尾花标签数组行列\n', iris.target.shape)# 数据集划分
def Data_Split():# 训练集、测试集划分APItrain_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target, test_size=0.2)#训练集特征值 测试集特征值 训练集目标值 测试集目标值 训练集测试集划分API 训练集 测试集 测试量# 显示(训练集/测试集的特征值/目标值)print('训练集特征值:', train_data.shape)print('测试集特征值:', test_data.shape)print('训练集目标值:', train_target.shape)print('测试集目标值:', test_target.shape)if __name__ == '__main__':# 获取数据集(鸢尾花)iris = load_iris()# 显示数据集信息# Show_Data()# 数据集划分Data_Split()
机器学习(1)机器学习基础 鸢尾花数据集相关推荐
- 机器学习入门案例:鸢尾花数据集分类 绘制PR曲线
案例使用鸢尾花数据集进行分类预测,并绘制评价分类性能的PR曲线图 认识分类任务和数据集 Iris(鸢尾花)数据集 案例演示中使用的是有监督的机器学习算法:SVM 支持向量机 建立模型的流程如下: 训练 ...
- 机器学习之有监督学习实例_01 —— 鸢尾花数据集的分类
Iris 数据集简介 : Iris Data Set(鸢尾属植物数据集)首次出现在著名的英国统计学家和生物学家Ronald Fisher 1936年的论文<The use of multiple ...
- 机器学习案例——鸢尾花数据集分析
前几天把python基础知识过了一遍,拿了这个小例子作为练手项目,这个案例也有师兄的帮助,记录完,发现代码贴的很多,文章有点长,为了节省篇幅,有一些说明就去掉了,毕竟鸢尾花数据集比较经典,网上 ...
- python鸢尾花数据集_鸢尾花经典机器学习分类Python实现案例
作者|Nature 出品|AI机器思维 由Fisher在1936年整理的Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例. 其数据集变量包含4个特征(Sepal.Len ...
- python机器学习之门之sklearn的使用(使用鸢尾花数据集)
sklearn全称为scikit learn 专门提供了python机器学习的模块 是一个高效的数据分析算法工具 建议在numpy scipy matplotlib上 对于大多数机器学习 通常有以下四 ...
- 《机器学习》分析鸢尾花数据集
转载地址:https://www.cnblogs.com/mandy-study/p/7941365.html 分析鸢尾花数据集 下面将结合Scikit-learn官网的逻辑回归模型分析鸢尾花示例,给 ...
- 机器学习--python代码实现基于Fisher的线性判别(鸢尾花数据集的分类)
一.线性分类–判断该函数属于哪一类 先上例题,然后我会通过两种方法来判断该函数属于哪一类 1.图解法 定义 对于多类问题:模式有 ω1 ,ω2 , - , ωm 个类别,可分三种情况: 第一种情况:每 ...
- 【机器学习】决策树案例二:利用决策树进行鸢尾花数据集分类预测
利用决策树进行鸢尾花数据集分类预测 2 利用决策树进行鸢尾花数据集分类预测 2.1 导入模块与加载数据 2.2 划分数据 2.3 模型创建与应用 2.4 模型可视化 手动反爬虫,禁止转载: 原博地址 ...
- 机器学习之sklearn基础教程!
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:李祖贤,深圳大学,Datawhale高校群成员 本次分享是基于sc ...
最新文章
- 词移距离 Word Mover‘s Distance
- android 高德定位 区域,区域定位-行政区划浏览-示例中心-JS API UI 组件示例 | 高德地图API...
- Java相对路径调用dll文件,VS项目中调用他人提供的.lib和.dll文件的用法(绝对路径和相对路径)...
- 2013\Province_Java_B\1.世纪末的星期
- 现代制造工程——考试复习01
- H7-TOOL | 以太网 - 动态IP(DHCP)功能测试
- [C++] string
- 用asp.net实现微博系统_微信几亿人在线的点赞、取消点赞系统,用Redis如何实现?...
- 如何才能精通C++?原来这点才最重要!
- python语言中的模块包括_python中常用的模块的总结
- 实战:tomcat版本升级
- HTML+CSS技术实现网页滑动门效果
- Java学习需要多久?程序员学习指南
- php连接mysql数据库 简洁代码
- 绕过tp路由器管理密码_路由器管理员密码忘了怎么办 路由器管理员密码忘了解决方法【介绍】...
- nginx实现301域名跳转
- iOS学习之路-简单汤姆猫
- AcWing 4783. 多米诺骨牌
- 中兴网卡连不上网,解决方案如下
- freeCodeCamp “限制可能的用户名“ 练习
热门文章
- android EditText 修改光标的颜色值
- 【BZOJ】2120: 数颜色
- BZOJ4152 AMPPZ2014 The Captain(最短路)
- Nexus2.x安装
- 每个程序员都需要学习 JavaScript 的7个理由
- innodb force recovery
- 如何获取元素最终使用的css值
- 为计算机编程序英语作文,计算机编程员英文简历范文
- java 嵌套对象转xml_Gson对Java嵌套对象和JSON字符串之间的转换 | 学步园
- java 1 11 111_45675678ystem111111111111