目录

一、机器学习基础理论

1、机器学习过程

2、机器学习分类

3、数据集返回值介绍

二、鸢尾花数据集(实战)

1、首先是获取数据集

2、显示数据集信息(可以不要)

三、数据集划分

1、数据集划分API

2、代码及效果

总代码


一、机器学习基础理论

1、机器学习过程

  1. 获取数据
  2. 数据处理
  3. 特征工程(特征值、目标值)(包括标准化)
  4. 算法训练 -> 得到模型
  5. 模型评估

2、机器学习分类(有监督/无监督)

学习阶段可用数据集

sklearn、kaggle、UCI

3、数据集返回值介绍

load返回小数据集fetch返回大数据集

返回datasets.base.Bunch数据类型(字典格式

标签(target):目标值

特征(data):特征值

返回方式1:dict['key']

返回方式2:dict.key

二、鸢尾花数据集(实战)

以上三种鸢尾花,分别为鸢尾花的三个标签

1、首先是获取数据集

# 获取数据集(鸢尾花)iris = load_iris()

2、显示数据集信息(可以不要)

# 显示数据集信息Show_Data()# 显示数据集
def Show_Data():# 鸢尾花数据集print('鸢尾花数据集\n\n', iris)# print('鸢尾花数据集描述\n', iris['DESCR'])# 鸢尾花标签# print('鸢尾花标签名称\n', iris.target_names)# print('鸢尾花标签数组\n', iris.target)# 鸢尾花特征值# print('鸢尾花特征值名称\n', iris.feature_names)# print('鸢尾花特征值\n', iris.data)# 数组行、列查看# print('鸢尾花特征数组行列\n', iris.data.shape)# print('鸢尾花标签数组行列\n', iris.target.shape)

三、数据集划分

为了给后面的模型评估留下数据,这里只能选取一部分数据进行模型训练

1、数据集划分API

sklearn.model_selection.train_test_split

返回:训练集特征值、测试集特征值、训练集目标值、测试集目标值

2、代码及效果

# 数据集划分
def Data_Split():# 训练集、测试集划分APItrain_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target, test_size=0.2)#训练集特征值 测试集特征值 训练集目标值    测试集目标值   训练集测试集划分API  训练集      测试集       测试量# 显示(训练集/测试集的特征值/目标值)print('训练集特征值:', train_data.shape)print('测试集特征值:', test_data.shape)print('训练集目标值:', train_target.shape)print('测试集目标值:', test_target.shape)

总代码

# 机器学习基础(鸢尾花数据集)
# sklearn.model_selection.train_test_split返回:
# 训练集特征值、测试集特征值、训练集目标值、测试集目标值。
import cv2
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split# 显示数据集
def Show_Data():# 鸢尾花数据集print('鸢尾花数据集\n\n', iris)# print('鸢尾花数据集描述\n', iris['DESCR'])# 鸢尾花标签# print('鸢尾花标签名称\n', iris.target_names)# print('鸢尾花标签数组\n', iris.target)# 鸢尾花特征值# print('鸢尾花特征值名称\n', iris.feature_names)# print('鸢尾花特征值\n', iris.data)# 数组行、列查看# print('鸢尾花特征数组行列\n', iris.data.shape)# print('鸢尾花标签数组行列\n', iris.target.shape)# 数据集划分
def Data_Split():# 训练集、测试集划分APItrain_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target, test_size=0.2)#训练集特征值 测试集特征值 训练集目标值    测试集目标值   训练集测试集划分API  训练集      测试集       测试量# 显示(训练集/测试集的特征值/目标值)print('训练集特征值:', train_data.shape)print('测试集特征值:', test_data.shape)print('训练集目标值:', train_target.shape)print('测试集目标值:', test_target.shape)if __name__ == '__main__':# 获取数据集(鸢尾花)iris = load_iris()# 显示数据集信息# Show_Data()# 数据集划分Data_Split()

机器学习(1)机器学习基础 鸢尾花数据集相关推荐

  1. 机器学习入门案例:鸢尾花数据集分类 绘制PR曲线

    案例使用鸢尾花数据集进行分类预测,并绘制评价分类性能的PR曲线图 认识分类任务和数据集 Iris(鸢尾花)数据集 案例演示中使用的是有监督的机器学习算法:SVM 支持向量机 建立模型的流程如下: 训练 ...

  2. 机器学习之有监督学习实例_01 —— 鸢尾花数据集的分类

    Iris 数据集简介 : Iris Data Set(鸢尾属植物数据集)首次出现在著名的英国统计学家和生物学家Ronald Fisher 1936年的论文<The use of multiple ...

  3. 机器学习案例——鸢尾花数据集分析

        前几天把python基础知识过了一遍,拿了这个小例子作为练手项目,这个案例也有师兄的帮助,记录完,发现代码贴的很多,文章有点长,为了节省篇幅,有一些说明就去掉了,毕竟鸢尾花数据集比较经典,网上 ...

  4. python鸢尾花数据集_鸢尾花经典机器学习分类Python实现案例

    作者|Nature 出品|AI机器思维 由Fisher在1936年整理的Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例. 其数据集变量包含4个特征(Sepal.Len ...

  5. python机器学习之门之sklearn的使用(使用鸢尾花数据集)

    sklearn全称为scikit learn 专门提供了python机器学习的模块 是一个高效的数据分析算法工具 建议在numpy scipy matplotlib上 对于大多数机器学习 通常有以下四 ...

  6. 《机器学习》分析鸢尾花数据集

    转载地址:https://www.cnblogs.com/mandy-study/p/7941365.html 分析鸢尾花数据集 下面将结合Scikit-learn官网的逻辑回归模型分析鸢尾花示例,给 ...

  7. 机器学习--python代码实现基于Fisher的线性判别(鸢尾花数据集的分类)

    一.线性分类–判断该函数属于哪一类 先上例题,然后我会通过两种方法来判断该函数属于哪一类 1.图解法 定义 对于多类问题:模式有 ω1 ,ω2 , - , ωm 个类别,可分三种情况: 第一种情况:每 ...

  8. 【机器学习】决策树案例二:利用决策树进行鸢尾花数据集分类预测

    利用决策树进行鸢尾花数据集分类预测 2 利用决策树进行鸢尾花数据集分类预测 2.1 导入模块与加载数据 2.2 划分数据 2.3 模型创建与应用 2.4 模型可视化 手动反爬虫,禁止转载: 原博地址 ...

  9. 机器学习之sklearn基础教程!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:李祖贤,深圳大学,Datawhale高校群成员 本次分享是基于sc ...

最新文章

  1. 词移距离 Word Mover‘s Distance
  2. android 高德定位 区域,区域定位-行政区划浏览-示例中心-JS API UI 组件示例 | 高德地图API...
  3. Java相对路径调用dll文件,VS项目中调用他人提供的.lib和.dll文件的用法(绝对路径和相对路径)...
  4. 2013\Province_Java_B\1.世纪末的星期
  5. 现代制造工程——考试复习01
  6. H7-TOOL | 以太网 - 动态IP(DHCP)功能测试
  7. [C++] string
  8. 用asp.net实现微博系统_微信几亿人在线的点赞、取消点赞系统,用Redis如何实现?...
  9. 如何才能精通C++?原来这点才最重要!
  10. python语言中的模块包括_python中常用的模块的总结
  11. 实战:tomcat版本升级
  12. HTML+CSS技术实现网页滑动门效果
  13. Java学习需要多久?程序员学习指南
  14. php连接mysql数据库 简洁代码
  15. 绕过tp路由器管理密码_路由器管理员密码忘了怎么办 路由器管理员密码忘了解决方法【介绍】...
  16. nginx实现301域名跳转
  17. iOS学习之路-简单汤姆猫
  18. AcWing 4783. 多米诺骨牌
  19. 中兴网卡连不上网,解决方案如下
  20. freeCodeCamp “限制可能的用户名“ 练习

热门文章

  1. android EditText 修改光标的颜色值
  2. 【BZOJ】2120: 数颜色
  3. BZOJ4152 AMPPZ2014 The Captain(最短路)
  4. Nexus2.x安装
  5. 每个程序员都需要学习 JavaScript 的7个理由
  6. innodb force recovery
  7. 如何获取元素最终使用的css值
  8. 为计算机编程序英语作文,计算机编程员英文简历范文
  9. java 嵌套对象转xml_Gson对Java嵌套对象和JSON字符串之间的转换 | 学步园
  10. java 1 11 111_45675678ystem111111111111