常用图表的用法-分布类
一. 背景概述
提到图表,大家最熟悉的莫过于曲线图、柱状图、饼图等,但是对于图表的系统性认识及不同场景下的应用常常会有所欠缺,即就是做到我有什么数据,需要哪些图表进行信息表达。此次主要对于常用图表(分布类)做以梳理。
二. 分布类图表
1.箱形图
2.散点图
3.直方图
4.气泡图
5.热力图
6.曲线图
三. 图表说明
1. 箱形图
箱形图又称盒须图、盒式图或箱线图,是一种用作显示一组数据分布情况的统计图。
如果一个数据集中包含了一个分类变量和一个或者多个连续变量,那么你可能会想知道连续变量会如何随着分类变量水平的变化而变化,而箱形图就可以提供这种方法,它只用了5个数字对分布进行概括,即一组数据的最大值、最小值、中位数、下四分位数及上四分位数。对于数据集中的异常值,通常会以单独的点的形式绘制。箱形图可以水平或者垂直绘制。
从箱形图中我们可以观察到:
一组数据的关键值:中位数、最大值、最小值等。
数据集中是否存在异常值,以及异常值的具体数值。
数据是否是对称的。
这组数据的分布是否密集、集中。
数据是否扭曲,即是否有偏向性。
适用场景:
2. 散点图
散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。
对于那些变量之间存在密切关系,但是这些关系又不像数学公式和物理公式那样能够精确表达的,散点图是一种很好的图形工具。但是在分析过程中需要注意,这两个变量之间的相关性并不等同于确定的因果关系,也可能需要考虑其他的影响因素。
适用场景:
3. 直方图
1)频数分布直方图
适用场景:
2)非标准的直方图
适用场景:
附注:直方图与柱状图
柱状图是以矩形的长度表示每一组的频数或数量,其宽度(表示类别)则是固定的,利于较小的数据集分析。
直方图是以矩形的长度表示每一组的频数或数量,宽度则表示各组的组距,因此其高度与宽度均有意义,利于展示大量数据集的统计结果。
由于分组数据具有连续性,直方图的各矩形通常是连续排列,而柱状图则是分开排列。
4. 气泡图
气泡图是一种多变量图表,是散点图的变体,也可以认为是散点图和百分比区域图的组合。
气泡图最基本的用法是使用三个值来确定每个数据序列,和散点图一样,气泡图将两个维度的数据值分别映射为笛卡尔坐标系上的坐标点,其中 X 和 Y 轴分别代表不同的两个维度的数据,但是不同于散点图的是,气泡图的每个气泡都有分类信息(他们显示在点旁边或者作为图例)。每一个气泡的面积代表第三个数值数据。
需要注意的是,气泡图的数据大小容量有限,气泡太多会使图表难以阅读。但是可以通过增加一些交互行为弥补:隐藏一些信息,当鼠标点击或者悬浮时显示,或者添加一个选项用于重组或者过滤分组类别。
适用场景:
5. 热力图
热力图(Heat Map),“热力图”一词最初是由软件设计师 Cormac Kinney 于 1991 年提出并创造的,用来描述一个 2D 显示实时金融市场信息。最开始的热力图,是矩形色块加上颜色编码。经过多年的演化,习语上的热力图,如今更规范,更被大多数人理解的是这种经过平滑模糊过的热力图谱。
热力图是非常特殊的一种图,其使用场景通常比较有限。AntV 中所定义的热力图是两个连续数据分别映射到 x、y 轴。第三个连续数据映射到颜色,这个数据通常有两种获取途径办法:
从原始数据里取出相应数据字段,直接输入。
通过封箱和计数统计,得到区域数据密度元数据并映射到颜色。
注意以下几点:
热力图尤其关注
分布
。热力图可以不需要坐标轴,其背景常常是
图片
或地图
。热力图一般情况用其专有的色系
彩虹色系
(rainbow)
适用场景:
6 .曲线图
分布曲线图展示的是一种概率分布,也是一种同统计学紧密结合的图表。分布曲线是一种对称的钟形曲线,具有均数等于0,标准差等于1的特点,从而使标准分数在实际运用时非常有用。
分布曲线图由以下元素构成:
横轴:表示自变量
纵轴:表示因变量
表示概率分布的分布曲线
欢迎参与原创分享,你的优秀,应该被更多人关注与学习!
常用图表的用法-分布类相关推荐
- pyecharts源码解读(12)图表类包charts之chart模块:常用图表基类Chart、直角坐标系图表基类RectChart、3D图表基类Chart3D
当前pyecharts的版本为1.9.0. pyecharts/charts/chart.py模块结构 pyecharts/charts/chart.py模块主要元素为4个类: Chart类:除复合图 ...
- 数据分析入门系列教程-常用图表
点击上方"菜鸟学Python",选择"星标"公众号 重磅干货,第一时间送达 今天我们来学习下数据可视化,其实在前面的章节中,我们也接触到了一些数据可视化的知识, ...
- 数据可视化:常用图表使用总结
文章对常见的数据可视化图表进行了简单的汇总分析,希望对你有益. 什么是数据可视化? 数据可视化,简简单单就是把数据展示出来吗?非也非也,其终极是为了满足用户对数据的价值期望,利用数据,借助可视化工具, ...
- 第五章. 可视化数据分析图表—常用图表的绘制2—直方图,饼形图
第五章. 可视化数据分析图 5.3 常用图表的绘制2-直方图,饼形图 本节主要介绍常用图表的绘制,主要包括直方图,饼形图. 1.直方图(matplotlib.pyplot.hist) 直方图,又称质量 ...
- java关键字的用法_JAVA常用关键字及其用法简要说明
JA V A常用关键字及其用法简要说明Abstract抽象的一个Java语言中的关键字,用在类的声明中来指明一个类是不能被实例化的,但是可以被其它类继承.一个抽象类可以使用抽象方法,抽象方法不需要实现 ...
- Tableau上面地图与条形图结合_Tableau | 20种常用图表(上文)
数据源:超市数据 使用工具:Tableau 数据源及Tableau工作簿 :https://pan.baidu.com/s/17oq4seZbP0reT8gh170KxQ 密码:pj3z 没错,以超市 ...
- Matlab——常用函数的用法总结(部分直接摘自mathwork,持续更新)
Matlab--常用函数的用法总结(部分直接摘自mathwork,持续更新) 文章目录 Matlab--常用函数的用法总结(部分直接摘自mathwork,持续更新) 一.绘图篇 1.图像显示形式 ①f ...
- 数据可视化之旅:常用图表对比
<七天数据可视化之旅>第五天:常用图表对比 作者:Destiny 来源:木东居士 Destiny,某物流公司数据产品经理,目前从事数据平台搭建和可视化相关的工作.持续学习中,期望与大家多多 ...
- Apache Echarts常用图表之折线图
文章目录 Echarts常用图表 折线图 1. 折线图的实现步骤 2. 折线图的常见效果 最大值\最小值 `markPoint` 平均值 `markLine` 标注区间 `markArea` 数值显示 ...
- 数据可视化ECharts的七大常用图表,看完就会用(1)
本文的后半部分:数据可视化ECharts的常用图表,看完就会用(2) 文章目录 数据可视化 什么是数据可视化? 数据可视化的好处 数据可视化的实现方式 ECharts ECharts的特性 一个ECh ...
最新文章
- Linux那些事儿 之 戏说USB(22)设备的生命线(五)
- 如何在浏览器上跑深度学习模型?并且一行JS代码都不用写
- SAP PM设备主记录
- 《上海市产业绿贷支持绿色新基建(数据中心)发展指导意见》印发了
- 【转】Android:ListView常见错位之CheckBox错位
- Codeforces Round #697 (Div.3) A~G解题报告与解法证明
- MapReduce词频统计
- Python+pywin32操作Excel文件常用功能(268行代码+注释)
- 电商大促特辑:蘑菇街致美丽新世界的架构礼
- IT要发掘有价值应用
- 7216:Minecraft题解
- MX160煲机音乐的选择
- 本科毕设完整流程和注意事项
- python分解GIF图
- 篆刻学简体——第一章
- opencv imwrite 之后与imread 图片变小原因与总结
- Raid控制器-megacli 命令简易使用介绍
- Guitar Pro 8win10最新版吉他学习 / 打谱 / 创作
- [转载]autorun.inf病毒源代码
- 如何快速制作证件照并压缩到100K?