数据分类概述

按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据数量数据

分类数据(categorical data)是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。

顺序数据(rank data)是只能归于某一有序类别的非数字型数据。顺序数据虽然是类别,但这些类别是有序的。

数值型数据(metric data)是按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的大多数是数值型数据。

数据类型与主要图示方法

代码实现

  • 条形图
import matplotlib.pyplot as plt  num_list = [1.5,0.6,7.8,6]
plt.bar(range(len(num_list)), num_list)
plt.show()

  • 饼图
import matplotlib.pyplot as pltlabels = ['A', 'B', 'C', 'D', 'others']
share = [0.45, 0.25, 0.15, 0.05, 0.10]
explode = [0, 0.1, 0, 0, 0]
plt.pie(share, explode = explode,labels = labels, autopct = '%3.1f%%',startangle = 180, shadow = True,colors = ['c', 'r', 'gray', 'g', 'y'])
plt.title('2017 Market Share')
plt.show()

  • 直方图
from matplotlib import pyplot as plt
from matplotlib import font_managera = [131, 98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119, 128, 121, 142, 127, 130, 124,101, 110, 116, 117, 110, 128, 128, 115, 99, 136, 126, 134, 95, 138, 117, 111, 78, 132, 124, 113, 150, 110, 117, 86,95, 144, 105, 126, 130, 126, 130, 126, 116, 123, 106, 112, 138, 123, 86, 101, 99, 136, 123, 117, 119, 105, 137,123, 128, 125, 104, 109, 134, 125, 127, 105, 120, 107, 129, 116, 108, 132, 103, 136, 118, 102, 120, 114, 105, 115,132, 145, 119, 121, 112, 139, 125, 138, 109, 132, 134, 156, 106, 117, 127, 144, 139, 139, 119, 140, 83, 110, 102,123, 107, 143, 115, 136, 118, 139, 123, 112, 118, 125, 109, 119, 133, 112, 114, 122, 109, 106, 123, 116, 131, 127,115, 118, 112, 135, 115, 146, 137, 116, 103, 144, 83, 123, 111, 110, 111, 100, 154, 136, 100, 118, 119, 133, 134,106, 129, 126, 110, 111, 109, 141, 120, 117, 106, 149, 122, 122, 110, 118, 127, 121, 114, 125, 126, 114, 140, 103,130, 141, 117, 106, 114, 121, 114, 133, 137, 92, 121, 112, 146, 97, 137, 105, 98, 117, 112, 81, 97, 139, 113, 134,106, 144, 110, 137, 137, 111, 104, 117, 100, 111, 101, 110, 105, 129, 137, 112, 120, 113, 133, 112, 83, 94, 146,133, 101, 131, 116, 111, 84, 137, 115, 122, 106, 144, 109, 123, 116, 111, 111, 133, 150]d = 6
num_bins = (max(a) - min(a)) // dplt.hist(a, num_bins)
plt.xticks(range(min(a), max(a) + d, d))plt.grid()
plt.show()

  • 线图
import pandas as pd
import matplotlib.pyplot as pltdata = pd.read_csv('/root/data/折线图.csv',engine = 'python',encoding = 'utf8'
)
data['reg_date'] = pd.to_datetime(data["reg_date"])
ga = data.groupby(by = ['reg_date'],as_index = False
)['id'].agg('count')
ga.columns = ['注册日期', '注册用户数']
Mcolour = (91/255, 155/255, 213/255, 1)
plt.ylim(0, 500)
plt.title('Num', color=Mcolour)
plt.xlabel('Date', color=Mcolour)
plt.ylabel('Num', color=Mcolour)
plt.xticks(color=Mcolour)
plt.yticks(color=Mcolour)
plt.plot(ga['注册日期'],ga['注册用户数'], '-', color=Mcolour)

  • 散点图
import pandas as pd
import matplotlib.pyplot as pltdata = pd.read_csv('/root/data/散点图.csv',engine = 'python',encoding = 'utf8'
)
plt.scatter(data['广告费用'], data['购买用户数'])

  • 气泡图
import matplotlib.pyplot as plt
import matplotlib as mpl
import numpy as npa = np.random.randn(100)
b = np.random.randn(100)plt.scatter(a, b, s=np.power(10*a+20*b, 2), c=np.random.rand(100),cmap=mpl.cm.RdYlBu, marker="o")plt.show()

数据可视化(python代码实现)相关推荐

  1. 多元统计分析 图标表示法 数据可视化 python 代码实现

    图的组成部分(取自matplotlib.org): 轮廓图 1.plt.contour( )方法 import matplotlib.pyplot as plt import numpy as np# ...

  2. Day1.数据可视化-Python语法

    数据可视化-Python基础语法 Python简单? 想学好数据分析,最好最快的方式是掌握Python语言. Python语言的强大 简洁,有大量的第三方库,功能强大(数据科学领域) Numpy 科学 ...

  3. 用来处理gwdac网站爬取的实验数据的python代码

    写了几个用来整理gwdac爬取的散射实验数据的python代码,在这里保存一下,免得以后找不到 代码一 把按组分类的实验数据转成一行一个数据点 import osobslist = (["D ...

  4. 大学物理实验——密立根油滴实验数据计算Python代码

    大学物理实验--密立根油滴实验数据计算Python代码 先手准备 import numpy as np 编写函数 def f(t,U):# 基本物理量准备rou = 981.0g = 9.80l = ...

  5. Python数据可视化 | Python实现Matplotlib系列colorbar的设置

    Python数据可视化 | Python实现Matplotlib系列colorbar的设置 目录 Python数据可视化 | Python实现Matplotlib系列colorbar的设置 color ...

  6. 利用OpenSearch API检索和下载数据 附Python代码实例

    利用OpenSearch API检索和下载数据 附Python代码实例 在数据下载过程中,我们常常会需要下载非常多的数据文件,这时我们可以利用wget等软件或者编写数据下载脚本来实现数据下载的批处理. ...

  7. 语义分割数据增强python代码

                                                           语义分割数据增强python-pytorch代码-语义分割github项目 0. 先放gi ...

  8. 视频教程-Python大数据可视化-Python

    Python大数据可视化 7年软件开发架构经验,12年IT培训经验,曾就职于拜特科技,金蝶软件,软酷网络等多家互联网公司.擅长Java EE,前端,iOS及大数据等技术方向的开发及教学.策划并撰稿大数 ...

  9. python做数据可视化的代码_Python数据可视化正态分布简单分析及实现代码

    Python说来简单也简单,但是也不简单,尤其是再跟高数结合起来的时候... 正态分布(Normaldistribution),也称"常态分布",又名高斯分布(Gaussiandi ...

  10. 数据可视化 | Python绘制多维柱状图:一图展示西部各省人口变迁【附本文数据和代码】

    查看原文:[数据seminar]https://mp.weixin.qq.com/s/pvx2ZzLbrBL-6cyOwVATOA Part1前言 柱状图是利用柱子的高度来反映数据差异的统计图,与一维 ...

最新文章

  1. 电磁学讲义6:高斯定理计算电场
  2. 了解 ElasticSearch 这几个知识点后,查询起飞~
  3. vector相关习题
  4. 系列(三)—Redis
  5. An Energy-Efficient Ant-Based Routing Algorithm for Wireless Sensor Networks (无线传感网中基于蚁群算法的能量有效路由)2
  6. html背景图适应div_CSS实现背景图片屏幕自适应
  7. Ubuntu在docker容器中安装TensorFlow-1.5
  8. Cesium整体架构介绍
  9. 自定义rest api的基本思想过程--总结
  10. svn添加新项目的步骤
  11. 【Verilog】一文了解verilog基础语法
  12. STM32编程环境配置(kile5)
  13. What?校花居然半夜问我要“软件”
  14. 看不懂英文怎么办!学习编程,英语对初学者很重要吗?
  15. M1 mac使用UTM安装kali linux
  16. matlab 定义局部变量,simulink定义全局变量
  17. Google Play开发者新功能:内部应用分享功能
  18. 30天早起感悟——我为什么要早起
  19. 爱快软路由对笔记本实现网络唤醒
  20. LeafChart(4)-绘制动画曲线图

热门文章

  1. oracle 行列转换函数
  2. 总结定时器设计方法_超实用!网站导航栏设计方法总结
  3. C语言模拟实现:atoi函数
  4. void* 指针有什么用
  5. 高通Linux Android 平台中的蓝牙功能学习 (4)-- Android Marshmallow 中的蓝牙 4.2
  6. Jetson学习笔记(一):jetson 系列镜像下载、烧写、设置散热风扇、中文包、pip、中转英目录、软件源、显示CSI摄像头
  7. LruCache的深入解析
  8. 《LRU Cache》
  9. Stay hungry, Stay foolish 的原义
  10. HTML+CSS绘制太阳系九大行星运行轨迹