8.5 简单的散点图

原文:Simple Scatter Plots

译者:飞龙

协议:CC BY-NC-SA 4.0

本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。

另一种常用的绘图类型是简单的散点图,是折线图的近亲。这里的点并不由线连接,而是单独表示的点,圆或其他形状。我们首先为绘图配置笔记本,并导入我们将使用的函数:

%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('seaborn-whitegrid')
import numpy as np

散点图和plt.plot

在上一节中,我们查看了生成折线图的plt.plot /ax.plot。事实证明,同样的函数也可以生成散点图:

x = np.linspace(0, 10, 30)
y = np.sin(x)plt.plot(x, y, 'o', color='black');

函数调用中的第三个参数是一个字符,表示用于绘图的符号类型。正如你可以指定选项,例如'-''--'`来控制线条样式,标记样式有自己的一组短字符串代码。完整的可用符号列表,可以在plt.plot``的文档中找到,或者在Matplotlib 的在线文档中看到。大多数选项非常直观,我们将在这里展示一些更常见的:

rng = np.random.RandomState(0)
for marker in ['o', '.', ',', 'x', '+', 'v', '^', '<', '>', 's', 'd']:plt.plot(rng.rand(5), rng.rand(5), marker,label="marker='{0}'".format(marker))
plt.legend(numpoints=1)
plt.xlim(0, 1.8);

为了获得更多选项,这些字符代码可以与线条和颜色代码一起使用,来绘制点以及连接它们的线:

plt.plot(x, y, '-ok');

plt.plot的附加关键字参数,指定了线条和标记的各种属性:

plt.plot(x, y, '-p', color='gray',markersize=15, linewidth=4,markerfacecolor='white',markeredgecolor='gray',markeredgewidth=2)
plt.ylim(-1.2, 1.2);

plt.plot函数的这种灵活性支持各种可能的可视化选项。可用选项的完整说明,请参阅plt.plot文档。

散点图和plt.scatter

第二种更强大的创建散点图的方法是plt.scatter函数,它的用法与plt.plot函数非常相似:

plt.scatter(x, y, marker='o');

plt.scatterplt.plot的主要区别是,它可用于创建散点图,其中每个单独的点的属性(大小,填充颜色,边缘颜色等)可以单独控制,或映射到数据。

让我们通过创建一个随机散点图,包含多种颜色和大小的点,来展示它。为了更好地查看重叠结果,我们还将使用alpha关键字来调整透明度:

rng = np.random.RandomState(0)
x = rng.randn(100)
y = rng.randn(100)
colors = rng.rand(100)
sizes = 1000 * rng.rand(100)plt.scatter(x, y, c=colors, s=sizes, alpha=0.3,cmap='viridis')
plt.colorbar();  # show color scale

请注意,颜色参数自动映射到颜色标度(此处由colorbar()命令显示),size参数以像素为单位。通过这种方式,点的颜色和大小可用于在可视化中传达信息,以便可视化多维数据。

例如,我们可能会使用来自 Scikit-Learn 的 Iris 数据,其中每个样本是三种类型的花朵中的一种,其花瓣和萼片的大小是仔细测量的:

from sklearn.datasets import load_iris
iris = load_iris()
features = iris.data.Tplt.scatter(features[0], features[1], alpha=0.2,s=100*features[3], c=iris.target, cmap='viridis')
plt.xlabel(iris.feature_names[0])
plt.ylabel(iris.feature_names[1]);

我们可以看到,这个散点图使我们能够同时探索数据的四个不同维度:每个点的(x, y)位置对应于萼片的长度和宽度,该点的大小与花瓣宽度有关,并且颜色与花的特定种类有关。像这样的多颜色和多特征散点图,对于数据探索和展示都是有用的。

plot VS scatter:效率的注解

除了plt.plotplt.scatter中提供的不同功能之外,为什么你选择使用一个而不是另一个? 虽然对于少量数据而言并不重要,因为数据集大于几千个点,plt.plot可能比plt.scatter明显更高效。原因是plt.scatter能够为每个点渲染不同的大小和/或颜色,因此渲染器必须执行单独构建每个点的额外工作。

另一方面,在plt.plot中,点基本上总是彼此的克隆,因此确定点的外观的工作,仅对整个数据集执行一次。对于大型数据集,这两者之间的差异可能会使性能大不相同,因此,对于大型数据集,plt.plot应优于plt.scatter

数据科学 IPython 笔记本 8.5 简单的散点图相关推荐

  1. 数据科学 IPython 笔记本 8.4 简单的折线图

    8.4 简单的折线图 原文:Simple Line Plots 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册>(Python Data Scienc ...

  2. 数据科学 IPython 笔记本 翻译完成

    原文:donnemartin/data-science-ipython-notebooks 译者:飞龙 协议:CC BY-NC-SA 4.0 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以 ...

  3. 数据科学 IPython 笔记本 8.10 自定义颜色条

    8.10 自定义颜色条 原文:Customizing Colorbars 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册>(Python Data S ...

  4. 数据科学 IPython 笔记本 8.9 自定义图例

    8.9 自定义图例 原文:Customizing Plot Legends 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册>(Python Data ...

  5. 数据科学 IPython 笔记本 8.3 Matplotlib 可视化

    8.3 Matplotlib 可视化 原文:Visualization with Matplotlib 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册> ...

  6. 数据科学 IPython 笔记本 8.15 Matplotlib 中的三维绘图

    8.15 Matplotlib 中的三维绘图 原文:Three-Dimensional Plotting in Matplotlib 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<P ...

  7. 数据科学 IPython 笔记本 8.14 自定义 Matplotlib:配置和样式表

    8.14 自定义 Matplotlib:配置和样式表 原文:Customizing Matplotlib: Configurations and Stylesheets 译者:飞龙 协议:CC BY- ...

  8. 数据科学 IPython 笔记本 8.12 文本和注解

    8.12 文本和注解 原文:Text and Annotation 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册>(Python Data Scie ...

  9. 数据科学 IPython 笔记本 8.7 密度和等高线图

    8.7 密度和等高线图 原文:Density and Contour Plots 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册>(Python Da ...

最新文章

  1. 模型越大,真的越香吗?千亿参数之后是万亿,万亿之后呢?
  2. java中引导页面的,设计模式之模板模式引导篇
  3. 接收不到其他机器发来的报文_大厂真实案例:线上四台机器同一时间全部 OOM......
  4. transformer模型_【预训练模型】万字长文梳理NLP预训练模型!从transformer到albert...
  5. 结构化和面向对象语言的区别
  6. OrderOnline——功能需求
  7. 在线直播网站源码开发,音视频同步的处理方案及选择
  8. ASP读取文件 ASP写入/保存文件
  9. 计算机基础备课计划,《计算机应用基础》教学计划备课讲稿.doc
  10. 中兴笔试c语言,中兴面试C语言题1
  11. 考研高数笔记(数一)--pdf文档 百度网盘自取
  12. 搅拌反应釜cad图纸_搅拌式反应釜设计(三维SW)【全套含有CAD图纸三维建模】...
  13. 小刘的刷题日记——day1 【CSES】Weird Algorithm
  14. 高数篇:06零点问题与微分不等式
  15. 【初级篇】网页引入live2d
  16. 陶泓达:决战小非农,阻击大非农,实时布局双农
  17. 如何使用 Echarts 和 SVG文件写大屏可视化地图 ?
  18. 网络问答口碑营销的作用和价值分析
  19. 1.如何实现MT4帐号同步交易?
  20. ECCV2022 | 基于整合IMU运动动力学的无监督单目深度估计

热门文章

  1. mysql5.7的客户端软件_mysql数据库管理客户端工具|mysql数据库管理软件 v5.7.22 64位官方版 - 软件下载 - 绿茶软件园|33LC.com...
  2. goto语句_C语言goto语句
  3. java实现浏览器ui中的收藏夹_谷歌改进Google Chrome浏览器中的PDF浏览器 带来全新UI...
  4. stm32 断路功能和互补输出
  5. 兰州大学c语言课程作业答案,兰州大学C语言程序设计课程作业1.doc
  6. php rest api lumen,使用Lumen框架创建 REST API 实例教程
  7. 网络爬虫python的特点有哪些_为什么写网络爬虫天然就是择Python而用
  8. ROS: global_planner 整体解析
  9. 菜鸟学习笔记:Java提升篇2(容器2——Map、Set、迭代器)
  10. 力扣724.寻找数组的中心索引