需要源码请点赞关注收藏后评论区留言私信~~~

一、数据透视表

数据透视表(Pivot Table)是数据分析中常见的工具之一,根据一个或多个键值对数据进行聚合,根据列或行的分组键将数据划分到各个区域

在Pandas中,除了使用groupby对数据分组聚合实现透视功能外,还可以使用pivot_table函数实现

pivot_table函数格式:     pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')

表4-5. pivot_table函数主要参数及其说明

pivot_table默认计算均值

import pandas as pd
import numpy as np
data = pd.DataFrame({'k1':['a','b','a','a','c','c','b','a','c','a','b','c'],'k2':['one',
'two','three','two','one','one','three','one','two','three','one','two'],
'w':np.random.rand(12),'y':np.random.randn(12)})
print(data)
print("------------------------------------------------")
print(data.pivot_table(index = 'k1',columns = 'k2'))

分类汇总并求和

data.pivot_table(index = 'k1',columns = 'k2',aggfunc = 'sum')

交叉表是一种特殊的透视表,主要用于计算分组频率

crosstab的格式

crosstab(index, columns, values=None, rownames=None, colnames=None, aggfunc=None, margins=False, dropna=True, normalize=False)

crosstab主要参数及其说明

交叉表示例

pd.crosstab(data.k1,data.k2)

带参数margin

pd.crosstab(data.k1,data.k2,margins = True)

二、Pandas可视化

Pandas中集成了Matplotlib中的基础组件,让绘图更加便捷

DataFrame.plot除了Series中的参数外,还有一些独特选项 如下表所示

1 线形图

Pandas库中的Series和DataFrame中都有绘制各类图表的plot方法,默认绘制的都是线形图

通过DataFrame对象的plot方法可以为各列绘制一条线,并创建图例

线形图一般用于描述两组数据之间的趋势

import matplotlib.pyplot as plt
%matplotlib inline
s = pd.Series(np.random.normal(size = 10))
s.plot()

通过DataFrame对象的plot方法可以为各列绘制一条曲线 并创建好图例

df = pd.DataFrame({'normal':np.random.normal(size = 50),'gamma':np.
random.gamma(1,size = 50)})
df.plot()

2 柱状图

柱状图一般描述各类别之间的关系,在Pandas中绘制柱状图只需在plot函数中加参数kind = ‘bar’,如果类别较多,可以绘制水平柱状图(kind = ‘barh’)

stu = {'name':['小明','王芳','赵平','李红','李涵'],'sex':['male','female','female','female','male'],'year':[1996,1997,1994,1999,1996]}
data = pd.DataFrame(stu)
print(data['sex'].value_counts())
print(data['sex'].value_counts().plot(kind = 'bar',rot = 30))

对DataFrame数据而言,每一行的值会成为一组

df = pd.DataFrame(np.random.randint(1,100,size = (3,3)),index =
{'one','two','three'},columns = ['I1','I2','I3'])
df.plot(kind = 'barh')

3 直方图和密度图

直方图用于频率分布,y轴为数值或比率。绘制直方图,可以观察数据值的大致分布规律。pandas中的直方图可以通过hist方法绘制

核密度估计是对真实密度的估计,其过程是将数据的分布近似为一组核(如正态分布)。通过plot函数的kind = ‘kde’可以进行绘制

wy = pd.Series(np.random.normal(size = 80))
s.hist(bins = 15,grid = False)
wy = pd.Series(np.random.normal(size = 80))
s.plot(kind = 'kde')

4 散点图

散点图主要用来表现数据之间的规律

通过plot函数的kind = 'scatter'可以进行绘制

wd = pd.DataFrame(np.arange(10),columns = ['A'])
wd['B'] = 2*wd['A']+4
wd.plot(kind = 'scatter',x = 'A',y = 'B')

 创作不易 觉得有帮助请点赞关注收藏~~~

【数据分析与可视化】Pandas可视化与数据透视表的讲解及实战(超详细 附源码)相关推荐

  1. 【数据挖掘】利用sklearn进行数据预处理讲解与实战(超详细 附源码)

    需要源码和PPT请点赞关注收藏后评论区留言私信~~~ scikit-learn提供的数据预处理相关的功能如下图 1. 数据标准化.平均去除和方差缩放 sklearn.preprocessing.sca ...

  2. Python数据分析小技巧:如何在Pandas中实现数据透视表?

    Python数据分析小技巧:如何在Pandas中实现数据透视表? 数据透视表是数据分析中非常有用的工具,可以帮助我们快速了解数据的结构.关联和趋势.在Pandas中,我们可以使用pivot_table ...

  3. 利用excel与Pandas完成实现数据透视表(文末赠书)

         文末赠书 数据透视表是一种分类汇总数据的方法.本文章将会介绍如何用Pandas完成数据透视表的制作和常用操作. 1,制作数据透视表 制作数据透视表的时候,要确定这几个部分:行字段.列字段.数 ...

  4. 利用excel与Pandas完成实现数据透视表

    数据透视表是一种分类汇总数据的方法.本文章将会介绍如何用Pandas完成数据透视表的制作和常用操作. 1,制作数据透视表 制作数据透视表的时候,要确定这几个部分:行字段.列字段.数据区,汇总函数.数据 ...

  5. 数据产品-数据可视化工具Excel之数据透视表

    数据产品接触的数据流程大致可以分为四个环节:数据采集.数据存储.数据计算和数据可视化,而Excel做为最基本的数据分析软件,可以在其中做很多数据的操作,其中数据透视表可以说是Excel最为功能强大的功 ...

  6. 【Python基础】在pandas中使用数据透视表

    文章来源于Python大数据分析,作者朱卫军 什么是透视表? 经常做报表的小伙伴对数据透视表应该不陌生,在excel中利用透视表可以快速地进行分类汇总,自由组合字段聚合计算,而这些只需要拖拉拽就能实现 ...

  7. excel自动排班表_Excel数据分析-如何制作自动更新的数据透视表

    数据透视表是我们工作中一个非常强大的数据汇总分析功能,大家一定会遇到这样的问题,就是数据源如果每天或者经常性需要更新的话,那么我们的数据透视表就要在每次更新后重新选择数据源,如何能让数据源自动更新呢? ...

  8. cyq.data mysql_CYQ.Data4.5.5下载-CYQ.Data数据框架整套下载4.5.5 免费版【附源码】-东坡下载...

    CYQ.Data是路过秋天分享的一款支持超多数据库的数据框架类库,它界面简洁,操作简单,功能强大易用,支持多语言,多数据库,RSS,AOP等功能,小编这附上CYQ.Data4.5.5整套下载. CYQ ...

  9. vue代码生成器可视化界面_手把手教你基于SqlSugar4编写一个可视化代码生成器(生成实体,以SqlServer为例,文末附源码)...

    在开发过程中免不了创建实体类,字段少的表可以手动编写,但是字段多还用手动创建的话不免有些浪费时间,假如一张表有100多个字段,手写有些不现实. 这时我们会借助一些工具,如:动软代码生成器.各种ORM框 ...

最新文章

  1. 超出网络bios会话限制_如何设置网络以防止数据丢失
  2. 手机号码 mysql 存储类型_2021-01-06:mysql中,我存十亿个手机号码,考虑存储空间和查询效率,用什么类型的字段去存?...
  3. 图像处理理论(八)——Meanshift, Camshift, Optical flow
  4. 【C++模板】特化与偏特化 template [partial] specialization
  5. cgi web 调用多次启动_全面了解CGI、FastCGI、PHPFPM
  6. ie浏览器收藏夹位置更改步骤
  7. php中统计记录条数,使用GROUP BY的时候如何统计记录条数 COUNT(*) DISTINCT
  8. Hive在linux上的部署
  9. Spark Yarn Client模式spark.driver.host导致 Cannot assign requested address: Service ‘sparkDriver‘ failed
  10. 效率源希捷硬盘远程维修案例-K9K10盘写认流程
  11. node.js 之 socket.io
  12. ArcView GIS 应用与开发技术(13)-定制ArcView
  13. 《数据库实验》实验一:建立数据库和基本表结构
  14. 翻译:Stairway to SQL Server Security Level 3: Principals and Securables
  15. 一起来做一个 c++ 单项选择题标准化考试系统
  16. 如何用计算机算幂函数,怎样用计算器算幂指数
  17. 大数据与云计算的关系?
  18. 力扣每日一题-10-121.买股票最佳时机
  19. 【unity 保卫星城】--- 开发笔记04(武器管理系统)
  20. Opus:IETF低延迟音频编解码器:API和操作手册

热门文章

  1. 都这么智能了,奥迪为什么连气味都处理不了?
  2. Unity 4.3 制作一个2D横版射击游戏(2)
  3. 有什么建站软件可以快速建网站?
  4. 还在为不熟悉快捷键的用法而苦恼吗?大神总结出来的方法都在这了
  5. 酒吧会员卡小程序制作设计,酒吧小程序开发制作定制功能和解决方案_document.getElementById(“demo“).innerHTML
  6. 信捷PLC3轴伺服钻孔机信捷触摸屏程序
  7. iFunk的笔记本基础硬件功能介绍
  8. python+云仓管理系统 毕业设计-附源码151458
  9. php获取落地页的信息,信息流广告落地页如何设计?落地页落地页设计注意事项...
  10. XMind 8 Update 9 安装出现一些问题