同学们你们好,猫老师又来更新了,我们在做数据分析的这个过程中,所用的数据集可以来源于实际的案例,也可以从网上寻找公开的数据资源,当然也可以编码生成一个随机数据集。本章采用Python的Sklearn机器学习库中自带的数据集——鸢尾花数据集。简单分析数据集之间特征的关系图,根据花瓣长度、花瓣宽度、花萼长度、花萼宽度四个特征进行绘图。

Iris plants data set数据集可以从Sklearn包里面直接拿到,也可以从KEEL dataset数据集网站获取。数据集共包含4个特征变量、1个类变量,一共有150个样本。类别变量分别对应鸢尾花的三个亚属,分别是山鸢尾 (Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

数据可视化可以更好地了解数据,主要调用Pandas扩展包进行绘图操作。

首先绘制直方图,直观的表现花瓣、花萼的长和宽特征的数量,纵坐标表示汇总的数量,横坐标表示对应的长度。

import pandas

#导入数据集iris

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = pandas.read_csv(url, names=names) #读取csv数据

print(dataset.describe())

#直方图 histograms

dataset.hist()

调用hist()函数实现,输出图形如下所示:

接下来通过dataset.plot()绘制散点图,这里设置三个参数,显示的x坐标、y坐标和设置绘图种类。

import pandas

#导入数据集iris

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = pandas.read_csv(url, names=names) #读取csv数据

print(dataset.describe())

dataset.plot(x='sepal-length', y='sepal-width', kind='scatter')

其中kind设置为scatter,而Matplotlib扩展包中scatter()函数也是用于绘制散点图的。

(未完待续)

python导入鸢尾花数据集_python可视化分析鸢尾花数据集相关推荐

  1. 使用Google Colab对PUBG的玩家死亡数据集进行可视化分析

    使用Google Colab对PUBG的玩家死亡数据集进行可视化分析 数据集 数据集可以在Kaggle(https://www.kaggle.com/)中找到.需要注册Kaggle账号后,Accoun ...

  2. Python使用matplotlib进行3D可视化分析:3d柱状图、3d直方图、3d线框图、3d曲面图、3d翼面图(莫比乌斯环)

    Python使用matplotlib进行3D可视化分析:3d柱状图.3d直方图.3d线框图.3d曲面图.3d翼面图(莫比乌斯环) 目录

  3. 【计算机专业毕设之基于python的nba爬虫数据可视化分析系统】

    [计算机专业毕设之基于python的nba爬虫数据可视化分析系统-哔哩哔哩https://b23.tv/BijZd9L 爬虫+Django+数据分析可视化

  4. python数据分析的发展前景_Python+BI分析5000条招聘数据,原来数据分析工作在这儿最好找...

    这两年的大数据热潮带火了数据分析这个职业,很多人想转行干数据分析,但是又不知道现在这个行业的求职环境和前景如何,动了心却不敢贸然行动. 前两天有个干运营的妹子找我聊天,也是问我数据分析岗位前景的问题, ...

  5. 基于Python的南京二手房数据可视化分析

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  6. python 节点关系图_python可视化节点关系(三):matplotlib(1)

    接下来,开始记录使用matplotlib这个号称python使用最广泛的图形库,所遇到的种种神坑. 一. 画节点图: 1. 画节点和箭头 查阅api文档,觉得annotate类封装的不错. impor ...

  7. Python + Neo4j(安装)可视化分析漫威十年人物关系图谱

    目录 1 数据爬取 1.1 漫威人物关系图谱网站 1.2 爬取人物关系数据 2 Neo4j的安装及服务启动 2.1 Neo4j下载安装 2.2 开启Neo4j服务 3 数据准备 3.1 加入列名 3. ...

  8. python爬去音乐_Python爬虫——分析酷我音乐网站,并爬取歌曲-Go语言中文社区

    前言: 爬取数据,我们都先必须了解开发者工具的使用和网页的源代码,即Python导入第三方库的步骤. 开发者工具使用步骤: 使用F12或者Ctrl+Shirt+i打开开发者工具 说明: 1)先检查HT ...

  9. 【手把手教你】Python获取财经数据和可视化分析

    内容来自:微信公众号:python金融量化 关注可了解更多的金融与Python干货. "巧妇难为无米之炊",找不到数据,量化分析也就无从谈起.对于金融分析者来说,获取数据是量化分析 ...

  10. python导入上级目录_Python导入上一级/下一级/任一级目录下的.py文件问题

    有如下目录: -python ----file1 ---------file1_1 ------------------pfile1_1.py ---------pfile1.py ----file2 ...

最新文章

  1. isnull的使用方法
  2. java 入门 第三季1
  3. url的三个js编码函数escape(),encodeURI(),encodeURIComponent()简介【转】
  4. bzoj2435: [Noi2011]道路修建 树上dp
  5. 当你负债累累,看不到方向,众叛亲离时,该如何面对?
  6. 指定JDK版本运行Tomcat
  7. mplayer-ww-37356 compile with mingw gcc 4.5.1 修复无法播放wmv
  8. matlab2013基础教程,Matlab2013a教程
  9. 【安卓小笔记】自己制作一个Launcher
  10. 使用 MitmProxy 玩爬虫的,这篇文章别错过了!
  11. 基于Tablestore的Wifi设备监管系统架构实现 1
  12. IAR+DAP/Jlink 下载并调试K60 (详细)
  13. Win10电脑键盘失灵打不出字解决方法分享
  14. SAP FI 系列 (034) - 应收票据冲销
  15. x265-1.8版本-x265.h代码注释
  16. 使用期望等待一次性事件
  17. KM算法 最优匹配(最大权匹配) hdu 2255 奔小康赚大钱 最小权匹配 poj 2195 Going Home
  18. Android开发之第一个小项目--我的MP3播放器(一)
  19. 模仿网易云微信小程序
  20. mysql连接报错too many connection

热门文章

  1. 基于C#的安全聊天工具设计
  2. SD卡的详细资料(开发文档)
  3. 产品经理应该看什么书?
  4. robot framework 添加selenium2library显示红色
  5. 【转】将 azw3 格式转换为 mobi 格式并保持原有排版格式
  6. vsto excel决跨表引用值不能更新的问题
  7. 有限差分法MATLAB程序
  8. 基于JSP的图书销售管理系统
  9. STM32F103学习笔记(7)——ISP串口下载程序
  10. xposed框架android9.0,xposed仓库商店下载