Python数据可视化之散点图

  • 介绍
  • 准备工作
    • 所需的库
    • 虚拟环境
  • 简单散点图
    • 总结
  • 两种不同颜色和图例的散点图
    • 总结

介绍

•数据可视化的应用十分广泛,几乎可以应用于自然科学、工程技术、金融、通信和商业等各种领域。下面我们基于Python,介绍一下第一个常用知识点—散点图

准备工作

所需的库

•为了使数据可视化我们需要安装下述的库,再进行可视化操作!!
       •numpy:NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库

pip install numpy -i https://pypi.douban.com/simple

pandas:Pandas 是 Python 语言的一个扩展程序库,用于数据分析,还是一个强大的分析结构化数据的工具集,基础是 Numpy(提供高性能的矩阵运算),还可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据

pip install pandas -i https://pypi.douban.com/simple

matplotlib:是 Python 2D-绘图领域使用最广泛的套件。它能让使用者很轻松地将数据图形化,并且提供多样化的输出格式

pip install matplotlib -i https://pypi.douban.com/simple

虚拟环境

•建议在开始操作python可视化之前,创建一个新的虚拟环境,方便管理与操作!!!
       •虚拟环境的作用:我们可以通过创建多个虚拟环境实现环境拆分,每个虚拟环境安装不同版本的库,从而满足不同的需求,各个虚拟环境之间相互独立、不对其它环境产生影响!!!
       •虚拟环境参考博文:python虚拟环境的安装与配置(究极详细易理解版!!!)
       •上述博文博主亲测有效!!!

简单散点图

•代码需求:绘制一个一元函数的散点图
       •使用matplotlib中的scatter()函数进行绘图!!
代码测试:

# 导入我们所需的库 as:即给库取别名,方便书写
import matplotlib.pyplot as plt
import numpy as np# 定义数据
x = np.random.rand(10)  # 取出10个随机数
y = x + x ** 2 - 10  # 用自定义关系确定y的值# 绘图
# 1. 确定画布
plt.figure(figsize=(8, 4))  # figsize:确定画布大小 # 2. 绘图
plt.scatter(x,  # 横坐标y,  # 纵坐标c='red',  # 点的颜色label='function')  # 标签 即为点代表的意思
# 3.展示图形
plt.legend()  # 显示图例plt.show()  # 显示所绘图形

图形展示:

•如果需要将图片保存到本地需将上述代码中的的plt.show() # 显示所绘图形更换成如下代码:

plt.savefig('需要保存图片的路径地址/图片名.jpg')  # 图片名可自定义(必须写图片名称.jpg)

总结

plt.show()不能和plt.savefig()同时使用,即为展示图片和保存图片不能同时使用!!
       •横坐标与纵坐标可以随意取值,但必须要有!!
       •当scatter()函数中有label属性时,必须要有显示图例语句!!即:plt.legend()
       •scatter()函数中还有s属性,为数据点尺寸大小!!

s=50 #数据点尺寸大小

横坐标x与纵坐标y的值是一一对应的,一个x对应生成一个y!!

两种不同颜色和图例的散点图

•代码需求:将十个不同的点分成(0,1)两类,每一类都展示不同的颜色!!!
代码测试:

# 导入我们所需的库 as:即给库取别名,方便书写
import matplotlib.pyplot as plt
import numpy as np# 生成数据
x = np.random.rand(10, 2)  # 生成10行 2列的数据集
y = np.array([0, 0, 1, 0, 1, 1, 0, 1, 0, 1])  # 二分类,将生成的数据点(x,y)分成0,1两类# 绘图
# 1.确定画布
plt.figure(figsize=(8, 4))colors = ['red', 'green']  # 建立颜色列表
labels = ['Zero', 'One']  # 建立标签类别列表# 2.绘图
for i in range(x.shape[1]):  # shape[] 类别的种类数量(2)plt.scatter(x[y == i, 0],  # 横坐标x[y == i, 1],  # 纵坐标c=colors[i],  # 颜色label=labels[i])  # 标签# 3.展示图形
plt.legend()  # 显示图例plt.show()  # 显示图片

图片展示:

总结

•当使用多种不同颜色来绘图时,需要使用循环在同一画布进行绘制,循环次数为分类的种类数量,即为:x.shape[1] x 分类种类数量 (2) !!
       •循环一次画一个颜色类别的点!!
       •需要分别建立颜色列表,标签类别列表,循环时进行使用!!
       •横,纵坐标使用切片的方式获得!!

Python数据可视化之散点图(基础篇---图文并茂详细版!!!)相关推荐

  1. Python数据可视化之散点图(进阶篇---图文并茂详细版!!!)

    散点图进阶篇 数据获取 数据展示 数据分析 1.确定横纵坐标的选择 2.准备标签的列表与颜色 4.确定横纵坐标的值 5.绘制基础图像 数据获取 •进阶散点图可视化需要大量的数据,网上有很多获取数据的来 ...

  2. Python数据可视化教程之基础篇

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 开运张 | 作者 知乎专栏 | 来源 https://zhuanlan.zhihu.c ...

  3. python数据可视化读取excell文件绘制图像详细教程

    python数据可视化读取excell文件绘制图像详细教程 python数据可视化 python库中的基本用法 import pandas as pd # 调用pandas库 来读取excell的文件 ...

  4. python数据查询教程_Python数据可视化教程之基础篇

    经过学习之后,我总结了利用python实现可视化的三个步骤: 确定问题,选择图形 转换数据,应用函数 参数设置,一目了然 1 首先,要知道我们用哪些库来画图? matplotlib python中最基 ...

  5. Python数据可视化之散点图和折线图

    最近一直用到Python的matplotlib包,一些画简单的散点图和折线图的用法老是记不住,所以从最基础的地方开始,稍微总结了一下. 一.散点图 画散点图时主要用到的是scatter函数. 随机产生 ...

  6. python数据可视化之美——基础

    编程基础 数据越来越多,人脑就那么大,我们要处理好数据,把数据转成图标比直接看数据更容易理解.有助于人做决策. 集合(set):由唯一元素组成的无序集,{}或set()创建. dc={key1:val ...

  7. Python数据可视化之Matplotlib-技巧篇

    常用技巧 特殊直线 画出过特定点的无穷直线,可以用 axline() 来实现. 确定平面直线:两个不同的点或者一个点和斜率 语法:plt.axline(xy1, xy2=None, *, slope= ...

  8. python数据可视化 matplotlib(2) 小白 - 典型图形进阶版:堆积折线图/并列柱状图/阶梯图/箱线图

    今天依然是matplotlib,在入门版的基础上加入了更多的组合和样式设置,matplotlib库是建立在Numpy基础上的绘图库. 典型统计图形对比 柱状图 堆积图:将若干统计图形堆叠起来的统计图形 ...

  9. Python数据可视化之绘制带有最佳拟合线的散点图(图文并茂版!!!)

    绘制带有最佳拟合线的散点图 最佳拟合线 数据准备 数据展示 图例选择 根据图例筛选数据 绘制图像 最佳拟合线 •当我们想要研究数据集中两个变量之间如何相互改变,使用最佳拟合线就是一个不错的方法!!   ...

最新文章

  1. 了解下WSDL 绑定
  2. oracle中ddl中enable,oracle 禁用表的DDL 实现真正的READ ONLY
  3. Amoeba软件实现mysql读写分离
  4. 程序猿小白应该注意什么
  5. asp向不同的用户发送信息_ASP.NET Core 中的那些认证中间件及一些重要知识点
  6. 洛谷 - P4014 分配问题(费用流/KM)
  7. 不锈钢厨房用品类织梦模板
  8. mysql主从应用_MySQL主从复制应用、主从复制原理
  9. pytorch: torch.nn.functional.affine_grid(theta,size)
  10. 图解自监督学习,从入门到专家必读的九篇论文
  11. 潍坊科技学院五专部计算机应用基础试题,14计算机应用基础(A)
  12. Nero 7序列号的验证方法
  13. uniapp canvas 合成头像
  14. resin log日志
  15. matlab tic和toc单位,matlab toc tic 的用法
  16. <<视觉问答>>2022:MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based VQA
  17. 利用tp5中的图像处理功能完成海报的图片合成
  18. Axure RP9 制作下拉式菜单
  19. 查看字符的所占字节数
  20. python面向对象书籍_python面向对象法实现图书管理系统

热门文章

  1. 《数据库》第1章 数据库系统概论
  2. AutoCAD二次开发,模拟三体运动,C#
  3. eclipse使用mapstruct_MapStruct使用学习
  4. 设计模式、框架、架构
  5. python 表达式求值_简单算术表达式求值
  6. win10下安装tesserocr失败(问题已解决,见文末)
  7. 【PP那些事儿】BOMRouting与ECN号
  8. 走进 DAO 时代:就像智能分布在各处的海星,当你打掉他身体的一部分,这个部分甚至会长成另一只海星...
  9. .shp .shx .dbf格式的文件怎么转换成.tab .map .id .d
  10. 数字化城市大脑赋能社会治理现代化体系新动能