利用PCA(主成分分析法)实现鸢尾花数据集的分类

依赖库 sklearn、matplotlib
安装方法 在终端输入

pip install sklearn
pip install matplotlib

以下为完整代码及注释

import matplotlib.pyplot as plt
#加载matplotlib用于数据的可视化
from sklearn.decomposition import PCA
#加载PCA算法包
from sklearn.datasets import load_iris
#加载鸢尾花数据集导入函数#降维
data = load_iris()
#以字典形式加载鸢尾花数据集
y = data.target
#使用y表示数据集中的标签
X = data.data
#使用x表示数据集中的属性数据
pca = PCA(n_components = 2)
#加载PCA算法,设置降维后主成分数目为2
reduced_X = pca.fit_transform(X)
#对原始数据进行降维,保存在reduced_X
red_x, red_y = [], []#第一类数据点
blue_x, blue_y = [], []#第二类数据点
green_x, green_y = [], []#第三类数据点
for i in range(len(reduced_X)):if y[i] == 0:red_x.append(reduced_X[i][0])red_y.append(reduced_X[i][0])elif y[i] == 1:blue_x.append(reduced_X[i][0])blue_y.append(reduced_X[i][1])else:green_x.append(reduced_X[i][0])green_y.append(reduced_X[i][1])
plt.scatter(red_x, red_y, c = 'r', marker = 'X')
#第一类数据点
plt.scatter(blue_x, blue_y, c = 'b',marker = 'D')
#第二类数据点
plt.scatter(green_x, green_y, c = 'g', marker = '.')
#第三类数据点
plt.show()
#可视化

效果如下图所示。上述代码中n_components为指定主成分的个数,即降维后数据的维度。可以自行选择进行尝试。

class PCA(self, n_components=None, copy=True, whiten=False, svd_solver='auto', tol=0.0, iterated_power='auto', random_state=None)

PCA方法中svd_solver参数也十分重要。svd_solver为设置特征值分解的方法,默认为‘auto’,其他可选有‘full’,‘arpack’,‘randomized’。

利用PCA(主成分分析法)实现鸢尾花数据集的分类相关推荐

  1. 机器学习--python代码实现基于Fisher的线性判别(鸢尾花数据集的分类)

    一.线性分类–判断该函数属于哪一类 先上例题,然后我会通过两种方法来判断该函数属于哪一类 1.图解法 定义 对于多类问题:模式有 ω1 ,ω2 , - , ωm 个类别,可分三种情况: 第一种情况:每 ...

  2. 机器学习:(PCA)主成分分析法及应用(spss)

    目录 1.1.主成分分析法简介 1.2.主成分分析法的意义 1.3.主成分分析法的思想 1.4.主成分分析法的步骤 2.1.导入数据 2.2.生成图表 3.1.PCA算法梯度求解 3.1.1. 梯度上 ...

  3. PCA主成分分析法详解

    第二次作业:PCA主成分分析(2021.03.18) 主成分分析(Principal Component Analysis,PCA)是一种常见的线性降维方法,广泛应用于图像处理.人脸识别.数据压缩.信 ...

  4. 机器学习之有监督学习实例_01 —— 鸢尾花数据集的分类

    Iris 数据集简介 : Iris Data Set(鸢尾属植物数据集)首次出现在著名的英国统计学家和生物学家Ronald Fisher 1936年的论文<The use of multiple ...

  5. PCA主成分分析法浅理解

    ML课刚学,发现更多是对线性代数的回顾.更进一步说,统计机器学习方法就是以高数.线代和概率论为基石构筑的"一栋大厦".下面主要沿着老师ppt的思路讲讲对PCA方法的个人理解. 这里 ...

  6. 机器学习(4):PCA主成分分析法实例

    一.简介 1.Principal Component Analysis 2.用途:降维中最常用的一种手段,可用于数据压缩.提取重要信息等领域. 3.目标:基于方差提取最有价值的信息 二.PCA求解原理 ...

  7. 数据分析案例-基于PCA主成分分析法对葡萄酒数据进行分析

  8. knn鸢尾花数据集java_机器学习——鸢尾花数据集(Knn分类)

    Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理.Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集.数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个 ...

  9. 毛慧昀:决策树实现对鸢尾花数据集的分类

    毛慧昀是华北电力大学计算机系大三的学生,LSGO软件技术团队(Dreamtech算法组)成员,参加了多期Datawhale的组队学习,荣获多期优秀队长的称号. 这篇图文是她在每周五晚参加线下组队学习活 ...

最新文章

  1. 软件测试理论之测试用例设计六把刀
  2. mysql字节对齐_结构体字节对齐-位域及其对齐
  3. Oracle创建表空间、创建用户以及授权、查看权限
  4. linux系统文件分类,Linux系统文件概念和文件类型
  5. 85. Maximal Rectangle
  6. 后宫宛如传服务器维护,合服丨《后宫宛如传》合服公告
  7. 华为畅享max有没有人脸识别_华为畅享7s有人脸识别吗 让我来告诉你
  8. ICCV 2021 LVIS Challenge 长尾分布实例分割挑战赛,冠军解决方案
  9. access主窗体名词解释_ACCESS 父子窗体的语法介绍
  10. 【机器学习】监督学习--(回归)多项式回归
  11. java请求报错(原因:CORS 头缺少 ‘Access-Control-Allow-Origin‘)
  12. 这本京东断货王的Python神书,刷爆整个编程圈!| 测评
  13. 2021 年系统分析师下午真题及答案
  14. 视频课程:CMOS模拟集成电路设计--已上线
  15. cad(2000坐标系)转kml
  16. 在夜神模拟器内部安装App
  17. steam服务器连接不稳定WIN10,小编操作win10系统steam连接不稳的解决步骤
  18. 玩转PS路径,轻松画logo!
  19. web项目各个文件夹的作用
  20. android路由器,Android工程师面试该怎么准备?年薪50W

热门文章

  1. Improved Consistency Regularization for GANs
  2. 2013 数字与智能油气田(国际)会议暨展会征文
  3. 苹果6手机怎么录屏_OPPO手机怎么录屏
  4. “富达杯”第三届深圳市国际物流行业篮球邀请赛隆重开幕
  5. MySQL数据库数据动态监控(canal+Kafka)
  6. 【Code Pratice】—— 递增三元组、比酒量、成绩分析
  7. 五年级上册计算机教学工作计划,人教版五年级上册数学教学工作计划
  8. 云计算的一些常见安全风险
  9. 高德地图获取行政区域以及中心点
  10. 小红书通过分享链接获取用户ID