一图胜千言,使用Python的matplotlib库,可以快速创建高质量的图形。

用matplotlib生成基本图形非常简单,只需要几行代码,但要创建复杂的图表,需要调用更多的命令和反复试验,这要求用户对matplotlib有深入的认识。

我们推出一个新的系列教程:Python数据可视化,针对初级和中级用户,将理论和示例代码相结合,分别使用matplotlib, seaborn, plotly等工具实现可视化。

本文主题是如何用Matplotlib创建直方图和密度图。

import 

1. 频数表

直方图(histogram)是探索数值型变量分布的方法,例如单峰还是双峰分布,是否接近钟型分布,左偏还是右偏等。

在创建直方图之前,首先要了解一个概念:频数表。

什么是频数表(frequency table)?

给定一个数值变量,将变量的极差(最大值与最小值的差)均匀地分割为多个等距分段,然后统计落入每个分段的数值个数。

然我们看一个具体的例子。

# 生成数值变量,假设服从标准正态分布

首先我们生成了100个标准正态变量,然后划分为10个等距的分段,然后统计了落入每个分段的数值个数。

例如落入'(-2.8, -2.22]'分段的个数有1个,而落入'(-0.49, 0.09]'分段的个数有18个,结果符合预期。

有更简单的方法实现频数表,调用pd.cut()函数。

pd

2. 直方图

直方图是频数表的可视化表达,x轴是等距,y轴是频数统计,通常用于探索数值变量的分布。

调用matplotlib.pyplot的hist()可以实现直方图。

fig

如果数据集有多个数值变量,可以在同一幅图中对比它们的分布。

当在同一幅图中创建多个直方图时,需要调整一下柱子的样式,才能得到较好的视觉效果。

np

3. 密度图

密度图是与直方图密切相关的概念,它用一条连续的曲线表示变量的分布,可以理解为直方图的”平滑版本“。

统计学经典理论假设样本数据来源于总体,而总体数据会服从某个分布(如正态分布,二项式分布等)。密度图采用”核密度统计量“来估计代表总体的随机变量的概率密度函数。

密度估计的课题比较复杂,这里不做深入。为了实现密度图,需要先创建一个数据框(pd.DataFrame),然后调用df.plot.density()。

np

如果喜欢我们的文章,记得点赞和收藏哦,我们每天都会为大家带来Python,数据科学和量化交易的精品内容。

【关于我们】

蜂鸟数据:国内领先的金融数据API提供商。

蜂鸟数据团队由业界顶尖的数据工程师,数据科学家和宽客组成,我们正努力构建一个强大的金融数据库,并提供API接口,目标是令金融数据开源化和平民化。

浏览并测试我们接口吧,目前覆盖股票,外汇,商品期货,数字货币和宏观经济领域,包括实时报价(tick)和历史数据(分钟),提供REST API和Websocket两种接入方式,能够满足金融分析师,量化交易和理财app的需求。

python hist函数_Python数据可视化:一文读懂直方图和密度图相关推荐

  1. python hist函数_Python主要数据探索函数

    Python中用于数据探索的库主要是pandas(数据分析)和 Matplotlib(数据可视化),其中pandas提供了大量的与数据库探索相关的函数,这些数据探索函数壳大致分为统计特征函数与统计绘图 ...

  2. 用python画熊_Python数据可视化:Pandas库,只要一行代码就能实现

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章一级AI入门学习 ,作者小伍哥 刚接触Python的新手.小白,可以复制下面的链接去免费观 ...

  3. python网易云_Python数据可视化:网易云音乐歌单

    网易云音乐2018年度听歌报告-遇见你,真好. 相信有不少人在上周,应该已经看过自己网易云音乐的年度报告了. 小F也是去凑凑热闹,瞅了一波自己的年度听歌报告. 那么你在云村又听了多少首歌,听到最多的歌 ...

  4. python matplotlib 地图_Python数据可视化,看这篇就够了

    说到python的常见应用,很多人会想到python的数据分析,作为数据分析中的表现层面,数据可视化都是其中必不可少的部分.但本文并非只推荐无任何数据分析需求仅需要做漂亮可视化图表的人学习python ...

  5. python plt包_Python 数据可视化-Matplotlib包学习笔记(一)

    Python 数据可视化 本文主要参照Matplotlib的官方教程进行整理,作为个人的学习笔记进行分享,欢迎相互讨论. Matplotlib包学习笔记(一) 本文主要简单介绍一下Matplotlib ...

  6. python界面散点图_Python数据可视化——散点图

    PS: 翻了翻草稿箱, 发现居然存了一篇去年2月的文章...虽然naive,还是发出来吧... 本文记录了python中的数据可视化--散点图scatter, 令x作为数据(50个点,每个30维),我 ...

  7. python组合数据分类_Python 数据可视化:分类特征统计图

    上一课已经体验到了 Seaborn 相对 Matplotlib 的优势,本课将要介绍的是 Seaborn 对分类数据的统计,也是它的长项. 针对分类数据的统计图,可以使用 sns.catplot 绘制 ...

  8. python柱形图代码_Python数据可视化:基于matplotlib绘制「条形图」

    简介 条形图 (bar chart)是用宽度相同条形的高度或长短来表示数据多少的图形,可以横置或纵置.纵置时的条形图也称为 柱形图 (column chart). 绘制条形图 1 import mat ...

  9. python画板颜色_Python数据可视化:Seaborn(二):色板

    在进行数据可视化处理的时候,常常会涉及到多个类的数据,有些时候默认的颜色并不是我们想要的,这时候,如果我们想要一些我们喜欢的颜色,就需要调整色板,下面我们就来介绍一下Seaborn的色板调整. 首先依 ...

最新文章

  1. VoVNet、VarGNet、PeleeNet:轻量级实时网络(嵌入端)
  2. jlinkarm目标程序和boot文件一起刷_华硕游戏手机Rog2代ROOT后wifi不能开启-刷回官方系统实用教程...
  3. Spring MVC报异常:org.springframework.web.util.NestedServletException: Request processing failed
  4. 拒绝平庸--浅谈WEB登录页面设计
  5. 解决TIME_WAIT过多造成的问题
  6. gamma校正_什么是Gamma校正?
  7. 数据库 CURD测试题【简单】
  8. 知识图谱入门知识(五)【转】秒懂词向量Word2Vec的本质
  9. 改进初学者的PID-介绍
  10. 第十一章:李淳风的秘谋
  11. 异构计算崛起,GPU加速计算服务器FP5468G2应运而生
  12. Soulver:不光会算,还懂你所言的计算器
  13. DNF私服商业服搭建教程
  14. vscode 初始化HTML结构
  15. 人工智能时代对会计行业的改变与反思
  16. 按键式计算器——人机交互的变革
  17. 2023程序员今年的一些现状
  18. 点到超平面距离的证明
  19. java将汉字转成拼音首字母大写字母_java实现将汉字转为首字母、拼音
  20. 随笔——网易云的神评论(持续更新)

热门文章

  1. 国产GPU的发展历程及芯片性能详解
  2. 新手必须要知道的用户粘性那些事儿
  3. 【数学思维】Quasi-convex and quesi-concave
  4. java:包装类类型判等、比较大小
  5. h3c交换设备 使用tftp server 备份与恢复配置
  6. Python3,掌握这4个自动化脚本,让工作效率提升200%。
  7. Express 4.x中间件morgan(logger)的详细解析
  8. 归并排序算法(C语言实现)
  9. Support for the experimental syntax ‘decorators‘ isn‘t currently enabled
  10. 直播预告:金融科技之区块链金融(第2讲)