利用PCA(主成分分析法)实现鸢尾花数据集的分类
利用PCA(主成分分析法)实现鸢尾花数据集的分类
依赖库 sklearn、matplotlib
安装方法 在终端输入
pip install sklearn
pip install matplotlib
以下为完整代码及注释
import matplotlib.pyplot as plt
#加载matplotlib用于数据的可视化
from sklearn.decomposition import PCA
#加载PCA算法包
from sklearn.datasets import load_iris
#加载鸢尾花数据集导入函数#降维
data = load_iris()
#以字典形式加载鸢尾花数据集
y = data.target
#使用y表示数据集中的标签
X = data.data
#使用x表示数据集中的属性数据
pca = PCA(n_components = 2)
#加载PCA算法,设置降维后主成分数目为2
reduced_X = pca.fit_transform(X)
#对原始数据进行降维,保存在reduced_X
red_x, red_y = [], []#第一类数据点
blue_x, blue_y = [], []#第二类数据点
green_x, green_y = [], []#第三类数据点
for i in range(len(reduced_X)):if y[i] == 0:red_x.append(reduced_X[i][0])red_y.append(reduced_X[i][0])elif y[i] == 1:blue_x.append(reduced_X[i][0])blue_y.append(reduced_X[i][1])else:green_x.append(reduced_X[i][0])green_y.append(reduced_X[i][1])
plt.scatter(red_x, red_y, c = 'r', marker = 'X')
#第一类数据点
plt.scatter(blue_x, blue_y, c = 'b',marker = 'D')
#第二类数据点
plt.scatter(green_x, green_y, c = 'g', marker = '.')
#第三类数据点
plt.show()
#可视化
效果如下图所示。上述代码中n_components为指定主成分的个数,即降维后数据的维度。可以自行选择进行尝试。
class PCA(self, n_components=None, copy=True, whiten=False, svd_solver='auto', tol=0.0, iterated_power='auto', random_state=None)
PCA方法中svd_solver参数也十分重要。svd_solver为设置特征值分解的方法,默认为‘auto’,其他可选有‘full’,‘arpack’,‘randomized’。
利用PCA(主成分分析法)实现鸢尾花数据集的分类相关推荐
- 机器学习--python代码实现基于Fisher的线性判别(鸢尾花数据集的分类)
一.线性分类–判断该函数属于哪一类 先上例题,然后我会通过两种方法来判断该函数属于哪一类 1.图解法 定义 对于多类问题:模式有 ω1 ,ω2 , - , ωm 个类别,可分三种情况: 第一种情况:每 ...
- 机器学习:(PCA)主成分分析法及应用(spss)
目录 1.1.主成分分析法简介 1.2.主成分分析法的意义 1.3.主成分分析法的思想 1.4.主成分分析法的步骤 2.1.导入数据 2.2.生成图表 3.1.PCA算法梯度求解 3.1.1. 梯度上 ...
- PCA主成分分析法详解
第二次作业:PCA主成分分析(2021.03.18) 主成分分析(Principal Component Analysis,PCA)是一种常见的线性降维方法,广泛应用于图像处理.人脸识别.数据压缩.信 ...
- 机器学习之有监督学习实例_01 —— 鸢尾花数据集的分类
Iris 数据集简介 : Iris Data Set(鸢尾属植物数据集)首次出现在著名的英国统计学家和生物学家Ronald Fisher 1936年的论文<The use of multiple ...
- PCA主成分分析法浅理解
ML课刚学,发现更多是对线性代数的回顾.更进一步说,统计机器学习方法就是以高数.线代和概率论为基石构筑的"一栋大厦".下面主要沿着老师ppt的思路讲讲对PCA方法的个人理解. 这里 ...
- 机器学习(4):PCA主成分分析法实例
一.简介 1.Principal Component Analysis 2.用途:降维中最常用的一种手段,可用于数据压缩.提取重要信息等领域. 3.目标:基于方差提取最有价值的信息 二.PCA求解原理 ...
- 数据分析案例-基于PCA主成分分析法对葡萄酒数据进行分析
- knn鸢尾花数据集java_机器学习——鸢尾花数据集(Knn分类)
Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理.Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集.数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个 ...
- 毛慧昀:决策树实现对鸢尾花数据集的分类
毛慧昀是华北电力大学计算机系大三的学生,LSGO软件技术团队(Dreamtech算法组)成员,参加了多期Datawhale的组队学习,荣获多期优秀队长的称号. 这篇图文是她在每周五晚参加线下组队学习活 ...
最新文章
- 软件测试理论之测试用例设计六把刀
- mysql字节对齐_结构体字节对齐-位域及其对齐
- Oracle创建表空间、创建用户以及授权、查看权限
- linux系统文件分类,Linux系统文件概念和文件类型
- 85. Maximal Rectangle
- 后宫宛如传服务器维护,合服丨《后宫宛如传》合服公告
- 华为畅享max有没有人脸识别_华为畅享7s有人脸识别吗 让我来告诉你
- ICCV 2021 LVIS Challenge 长尾分布实例分割挑战赛,冠军解决方案
- access主窗体名词解释_ACCESS 父子窗体的语法介绍
- 【机器学习】监督学习--(回归)多项式回归
- java请求报错(原因:CORS 头缺少 ‘Access-Control-Allow-Origin‘)
- 这本京东断货王的Python神书,刷爆整个编程圈!| 测评
- 2021 年系统分析师下午真题及答案
- 视频课程:CMOS模拟集成电路设计--已上线
- cad(2000坐标系)转kml
- 在夜神模拟器内部安装App
- steam服务器连接不稳定WIN10,小编操作win10系统steam连接不稳的解决步骤
- 玩转PS路径,轻松画logo!
- web项目各个文件夹的作用
- android路由器,Android工程师面试该怎么准备?年薪50W