**

数据可视化——鸢尾花数据集的分析及散点图的绘制

话不多说,直接上代码。

我们先来看一下鸢尾花数据集。

#读取鸢尾花卉数据集,绘制“花瓣长度”和“花瓣宽度”特征之间的散点图。

在导入如下几个库之前,请首先检查pip list,即个人PC是否已经安装了对应的第三方库。

安装命令:pip install

如果遇到安装超时的情况,可以使用清华的源:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple

更换为要下载的第三方库

import numpy as np

import pandas as pd

from sklearn.cluster import KMeans#K-means算法

import matplotlib.pyplot as plt

plt.rcParams[‘font.sans-serif’]=[‘SimHei’]#用来正常显示中文

iris_data=pd.read_csv(r’./iris.csv’)

X=iris_data[[‘petal_length’,‘petal_width’]]

print(X.shape)#这里看一下有没有数据缺失

#绘制数据分布图

estimator=KMeans(n_clusters=3)#构造聚类器

estimator.fit(X)#聚类

label_pred=estimator.labels_#获取聚类标签

#开始绘制K-means结果

x0=X[label_pred==0]#对应setosa

x1=X[label_pred==1]#对应vigincia

x2=X[label_pred==2]#对应versicolor

#这里使用了df.values,因为操作的是一个dataframe类型,所以应该转换成ndarry

plt.scatter(x0.values[:,0],x0.values[:,1],c=‘r’,marker=‘o’,label=‘setosa(山鸢尾)’)

plt.scatter(x1.values[:,0],x1.values[:,1],c=‘g’,marker=‘o’,label=‘virgincia(维吉尼亚鸢尾)’)

plt.scatter(x2.values[:,0],x2.values[:,1],c=‘blue’,marker=‘o’,label=‘versicolor(变色鸢尾)’)

plt.xlabel(‘petal_length(花瓣长度)’)

plt.ylabel(‘petal_width(花瓣宽度)’)

plt.title(‘花瓣长度和花瓣宽度特征之间的散点图’)

plt.legend(loc=2)#把图例放到左上角

plt.show()

#读取鸢尾花卉数据集,绘制“花萼长度”和“花萼宽度”特征之间的散点图。

import numpy as np

import pandas as pd

from sklearn.cluster import KMeans#K-means算法

import matplotlib.pyplot as plt

plt.rcParams[‘font.sans-serif’]=[‘SimHei’]#用来正常显示中文

iris_data=pd.read_csv(r’./iris.csv’)

X=iris_data[[‘sepal_length’,‘sepal_width’]]

print(X.shape)#这里查看一下有没有数据缺失

#绘制数据分布图

estimator=KMeans(n_clusters=3)#构造聚类器

estimator.fit(X)#聚类

label_pred=estimator.labels_#获取聚类标签

#开始绘制K-means结果

x0=X[label_pred==0]#对应setosa

x1=X[label_pred==1]#对应vigincia

x2=X[label_pred==2]#对应versicolor

#这里使用了df.values,因为操作的是一个dataframe类型,所以应该转换成ndarry

plt.scatter(x0.values[:,0],x0.values[:,1],c=‘r’,marker=‘o’,label=‘setosa(山鸢尾)’)

plt.scatter(x1.values[:,0],x1.values[:,1],c=‘g’,marker=‘o’,label=‘virgincia(维吉尼亚鸢尾)’)

plt.scatter(x2.values[:,0],x2.values[:,1],c=‘blue’,marker=‘o’,label=‘versicolor(变色鸢尾)’)

plt.xlabel(‘sepal_length(花萼长度)’)

plt.ylabel(‘sepal_width(花萼宽度)’)

plt.title(‘花萼长度和花萼宽度特征之间的散点图’)

plt.legend(loc=2)#把图例放到左上角

plt.show()

就是这么多了,不会的可以私聊。

祝大家学习愉快。

原文链接:https://blog.csdn.net/Harry_Stephen/article/details/106696230

python导入鸢尾花数据集_数据可视化——鸢尾花数据集的分析与散点图的绘制相关推荐

  1. python图形界面实践_数据可视化之实践篇——python

    一.10个可视化例子 import matplotlib.pyplot as plt import seaborn as sns import numpy as np import pandas as ...

  2. python画图怎么调色_数据可视化Seaborn从零开始学习教程(二) 颜色调控篇

    作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 Seaborn学习大纲 seaborn的学习内容主要包含以下几个部分: 风格管理 绘图风格设置 颜色风格设置 绘图方 ...

  3. python 桑基图_数据可视化之 Sankey 桑基图的实现

    什么是桑基图 Google 搜索桑基图,可以搜到一大堆定义.简而言之,桑基图是一种数据流图,展示了数据是如何从左到右流向最后的节点,每条边代表一条数据流,宽度代表数据流的大小.桑基图常用于流量分析,可 ...

  4. 机器学习算法:基于鸢尾花(iris)数据集的数据可视化 (200+收藏)

    文章目录 基于鸢尾花(iris)数据集的数据可视化 1.数据导入 2.查看样本数据 3.特征与标签组合的散点可视化 3.1. 散点图 3.2. 箱型图 3.2. 三维散点图 想要看更加舒服的排版.更加 ...

  5. python程序员专用壁纸_数据可视化!看看程序员大佬都推荐的几大Python库

    数据可视化是数据分析中极为重要的部分,而数据可视化图表(如条形图,散点图,折线图,地理图等)也是非常关键的一环.Python作为数据分析中最流行的编程语言之一,有几个库可以创建精美而复杂的数据可视化, ...

  6. 数据图表可视化_数据可视化如何选择正确的图表第1部分

    数据图表可视化 According to the World Economic Forum, the world produces 2.5 quintillion bytes of data ever ...

  7. 使用Python Seaborn和Pandas进行数据可视化

    Hey, folks! Today we will be unveiling a very interesting module of Python - Seaborn Module and will ...

  8. python实现的电影票房数据可视化

    代码地址如下: http://www.demodashi.com/demo/14275.html ##详细说明: Tushare是一个免费.开源的python财经数据接口包.主要实现对股票等金融数据从 ...

  9. python与excel做数据可视化-Python的Excel操作及数据可视化

    Excel表操作 python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库. 安装xlrd pip install xlrd 简单的表格读取 ...

  10. Python使用tsne进行高维数据可视化实战:二维可视化、三维可视化

    Python使用tsne进行高维数据可视化实战:二维可视化.三维可视化 # 绘制二维可视化图像并添加标签字符函数 def plot_embedding(data, label, title):x_mi ...

最新文章

  1. [Windows编程] 如何捕捉程序异常/crash 并生成 dump 文件
  2. OpenStack Network --- introduction部分 阅读笔记
  3. 实验仪器参数关系表达与传递
  4. 李开复:AlphaGo 若打败了世界冠军,意味着什么?
  5. 【转】Unity3d:读取FBX中的动画
  6. php 自旋锁,Linux内核自旋锁使用笔记
  7. 吴恩达DeepLearningCourse1-神经网络和深度学习
  8. 计算机表示法是知识 表示法么,计算机三级考试关于IP地址知识点
  9. python如何在函数中使用全局变量
  10. 【报告分享】2020中国股民图鉴.pdf(附下载链接)
  11. 进入路由器boot的方式
  12. 腾讯测试岗位的面试题合集,请查收
  13. 程序员经常浏览的网站
  14. redefinition of class解决
  15. python网易云音乐下载,可选择歌曲,下载路径
  16. 银河麒麟V10业务系统适配记录 处理器:FT2000+ 中国信创服务社区
  17. sqlserver错误码
  18. 「HNSDFZ暑期集训 测试1」「LuoguT36488」 连连看
  19. 梦回JDBC —— (Statement对象)
  20. 计算机系毕业论文写什么,计算机系的毕业论文 怎么写?

热门文章

  1. java毕业生简历_一个18年毕业生的Java简历
  2. ad9修改焊盘阻焊层大小
  3. 一次 注册dll失败 的经历
  4. 简谈libxml2库函数的使用
  5. excel培训机构_不会excel的,不是好地产人
  6. dsp31段最佳调音图_均衡器如何使用_31段均衡器调整方法
  7. 实用主义学python爬虫_麻瓜编程 实用主义学Python2018
  8. stm32车牌识别_道路千万条,方案这一条,带你深入了解车牌号识别系统
  9. 【githubshare】一款开源的卡通头像生成器,可自定义发型、眼镜、肤色、衣着、嘴型等属性
  10. 【微信支付】小案例,Java版