一  用表格方式汇总两个变量的数据

1  交叉分组表

常用于一个变量为分类型变量,一个变量为数量型变量

下面是由洛杉矶300家饭店组成的一个样本,其质量等级与参加数据的应用。

质量等级是一个分类变量,等级类别:好,很好,优秀

餐价是一个数量变量,变化的范围:10~49,被分为四个组:10~19, 20~29, 30~39, 40~49

绘制的交叉分组表如下:

二   图形显示方式汇总两个变量的数据

1  复合条形图与结构条形图

使用复合条形图比较不同质量评级的饭店参加的不同,可视化图如下:

下面是代码:

import numpy as np
import matplotlib.pyplot as plt# 设置中文为仿宋,避免中文乱码
plt.rcParams['font.sans-serif'] = ['Adobe Fangsong Std']
plt.rcParams['axes.unicode_minus'] = Falsedef work4():N = 4   # 频数分布中的组数width = 0.27    # bar widthg_arr = [53.8, 33.9, 2.6, 0.0]  # 评级为好的餐厅,餐价的百分频数分布vg_arr = [43.6, 54.2, 60.5, 21.4]   # 评级为很好的餐厅,餐价的百分频数分布yx_arr = [2.3, 11.9, 36.8, 78.6]    # 评级为优秀的餐厅,餐价的百分频数分布fig, ax = plt.subplots()ind = np.arange(N)good = ax.bar(ind, g_arr, width, color='#DEB887')verygood = ax.bar(ind+width, vg_arr, width, color='#5F9EA0')yx = ax.bar(ind+width+width, yx_arr, width, color='#A52A2A')ax.set_xticks(ind+width)ax.set_xticklabels(['10~19', '20~29', '30~39', '40~49'])ax.legend((good[0], verygood[0], yx[0]), ('好', '很好', '优秀'))def autolabel(rects):for rect in rects:height = rect.get_height()hcap='$'+str(height)ax.text(rect.get_x()+rect.get_width()/2.0, height, hcap,ha='center', va='bottom', rotation='vertical')autolabel(good)autolabel(verygood)plt.show()return

使用结构条形图比较不同质量评级的饭店参加的不同,可视化图如下:

这里使用了pandas

fv1 = [53.8, 43.6, 2.3]     # 10~19餐价对应的不同评级百分频数分布fv2 = [33.9, 54.2, 11.9]fv3 = [2.6, 60.5, 36.8]fv4 = [0.0, 21.4, 78.6]data_arr = np.array([fv1, fv2, fv3, fv4])df = pd.DataFrame(data_arr, index=['10~19', '20~29', '30~39', '40~49'],columns=pd.Index(['好', '很好', '非常好'], name='分类'))df.plot.bar(stacked=True, title='餐价的评级分布')plt.show()

描述统计学(二):汇总两个变量数据间关系相关推荐

  1. 两个变量数据交换的方法

    这里给出了3个方法用来交换两个变量数据 1.最常见的创建一个临时变量来交换两个变量的数据 int a=1,b=2; int temp; temp=a; a=b; b=temp; 这样就能通过创建的临时 ...

  2. correl函数相关系数大小意义_相关系数越大,说明两个变量之间的关系就越强吗...

    展开全部 相关系数越大,说明两个变量之间的关系就越强.当相关系数为1时,两个变量其e68a84e8a2ad3231313335323631343130323136353331333431353431实 ...

  3. 树中数据间关系整理~节点关系及用途解析及常用术语整理

    下文中如果没有详尽说明,则树指二叉树 1.二叉树上度为0的节点总比度为2的节点多一个! 据此关系,可以通过较少的二叉树条件判断二叉树构成 2.普通树中节点数=树中所有节点总度数+1 3.第i层节点数最 ...

  4. Python数据分析第十二课:单变量、双变量及多变量分析图

    一.单变量分析绘图 什么是单变量分析? 单变量其实就是我们通常接触到的数据集中的一列数据. 单变量分析是数据分析中最简单的形式,其中被分析的数据只包含一个变量.因为它是一个单一的变量,它不处理原因或关 ...

  5. 【Windows 逆向】内存地址分析 ( 内存条 | 虚拟内存 | 内存地址及寻址范围 | 内存地址与数据的关系 )

    文章目录 一.内存地址 1.内存条 2.虚拟内存 3.内存地址及寻址范围 二.内存地址与数据的关系 一.内存地址 1.内存条 启动设备后 , 运行的是操作系统 , 然后在操作系统中 , 运行的是应用软 ...

  6. 数据分析介绍之二——单变量数据观察之直方图

    数据分析介绍之二--单变量数据观察之直方图 点和抖动图很好,因为它们很简单. 然而,它们既不漂亮也不直观,最重要的是,它们难以从图中读出定量信息. 特别是,如果我们处理较大的数据集,那么我们需要一个更 ...

  7. R语言ggplot2可视化散点图、可视化两个数值变量之间的关系、使用geom_smooth函数基于loess方法拟合数据点之间的趋势关系曲线、自定义数据点的大小、色彩、添加主标题、副标题、题注信息

    R语言ggplot2可视化散点图.可视化两个数值变量之间的关系(Scatter plot).使用geom_smooth函数基于loess方法拟合数据点之间的趋势关系曲线.自定义数据点的大小.色彩.添加 ...

  8. python输入两个变量的值、输出大的_Python 变量和输入输出 关卡二

    练习题1 认识python 要求: 1.什么是python的交互模式,如何进入python交互模式1)在终端可以进入Python环境,或用Python3进入,通常用来做测试或调试 2)shift+鼠标 ...

  9. 二位数组的随机生成,遍历,求和,反转。和两个变量的^反转 源码

    import java.util.Random;/*** derf*/ public class Operate {public static void main(String[] args) {in ...

最新文章

  1. CF1592D Hemose in ICPC ?
  2. c语言10个数如何求最大值,C语言,输入10个数怎样输出10个数中最大值,最小值(大一计算机)...
  3. 数据库服务器主机重启故障诊断分析
  4. 【算法】普里姆算法 Prim算法解决修路问题
  5. 密码密文 android,Android登录页面密码明文密文的切换
  6. 【珍藏】2020年AI、CV、NLP顶会最全时间表!
  7. axure element元件_Axure教程,产品小白从0学起
  8. win8计算机休眠的区别,win8系统的休眠和睡眠有什么区别?如何用?
  9. php被挂马,近日报网站被挂马的解决方法
  10. Cplusplus实现的爱心代码,爱心里面有三个字李欣怡
  11. Java计算两个时间的月份差值
  12. 基于微信小程序的评分小程序
  13. 手动实现JDK动态代理,报错:$Proxy0 cannot be cast to异常
  14. Settings学习
  15. 华为2018优招 解决方案技术工程师
  16. 玩转iOS开发:集成 Union Pay - 银联支付
  17. es中document的主键id及局部更新
  18. 基于Matlab实现微波带低通高通带通滤波器设计
  19. elastic:Another Kibana instance appears to be migrating the index
  20. 地理学优质核心期刊汇总(论文投稿必备)

热门文章

  1. mysql能不能存储图片_韩魔方视频app下载免费_电脑知识学习网
  2. 【英语】常见连音规则
  3. 中国大学生实习大数据分析报告
  4. 什么是 COB 灯?
  5. linux安装activeMQ 5.16 以及集群环境
  6. RT_thread STM32通用Bootloader 做OTA升级
  7. JSP实验室预约管理系统
  8. 11月24日学习笔记_map/reduct的应用于使用
  9. Mac 上编译MapBox Native gl
  10. 人行征信2.0对接服务:全业务种类数据,精细您的征信业务管理!