透视图和交叉表

在数据分析中,数据透视表是常见的工具之一,需要根据行或列对数据进行各个维度数据的汇总,在pandas中,提供了相关函数解决此类问题

透视图相关函数

pivot_table(data,index,colums,values,aggfunc,fill_value,margins,margins_name=)

  • index: 行索引
  • colums: 列索引
  • values: 分组的字段,只能为数值型变量
  • aggfunc: 聚合函数
  • fill_value: 缺失值填充方法
  • margins: 是否需要总计
import pandas as pd
import numpy as np
import os
os.chdir('G:jupyterNotebookNetwordFile')df=pd.read_csv('vgsales.csv',dtype={'Year':float})pd.pivot_table(data=df,index='Year',values='Global_Sales',aggfunc=np.mean,margins=True,margins_name='总计求均值')pd.pivot_table(data=df,index='Year',columns='Genre',values='Global_Sales',aggfunc=np.mean,margins=True,margins_name='总计求均值')pd.pivot_table(data=df,index='Year',columns='Genre',values='Global_Sales',aggfunc=np.mean,margins=True, fill_value=0,margins_name='总计求均值')pd.pivot_table(data=df,index='Year',columns='Genre',values='NA_Sales',aggfunc=[np.sum,np.median],margins=True, fill_value=0,margins_name='总计求均值').head(10)pd.pivot_table(data=df,index=['Year','Platform'],columns='Genre',values='NA_Sales',aggfunc=np.mean,margins=True, fill_value=0,margins_name='总计求均值').head(10)

交叉表

:计算分组频率、次数

pd.crosstab(index=df['Platform'],columns=df=['Genre'],margins=True)pd.crosstab(index=df['Platform'],columns=df=['Genre'],margins=Truevalues=df['NA_Sales'],aggfunc=np.sum )pd.crosstab(index=df['Platform'],columns=df=['Genre'],normalize='all',#标准化margins=True)pd.crosstab(index=df['Platform'],columns=df=['Genre'],normalize='index',#标准化margins=True)pd.crosstab(index=df['Platform'],columns=df=['Genre'],normalize='columns',#标准化margins=True)

crosstab交叉表_透视图和交叉表相关推荐

  1. sql 取两个表_图撕SQL表联结

    从SQL调数据的时候,往往我们需要的字段并不在一个表里面,很多时候它们分布在不同的表里面,这时候就需要用到多表查询. 常见的几种表联结的方法,比如内联结(inner join).左联结也叫左外联结(l ...

  2. mysql 分库分表 建表_【分库分表】sharding-jdbc实践—分库分表入门

    一.准备工作 1.准备三个数据库:db0.db1.db2 2.每个数据库新建两个订单表:t_order_0.t_order_1 DROP TABLE IF EXISTS`t_order_x`;CREA ...

  3. java实现将A表数据转移到B表_解决用B表跟新A表数据,如果A表中没有,则把B表的数据插入A表(merge into)...

    作用:merge into 解决用B表跟新A表数据,如果A表中没有,则把B表的数据插入A表: 语法: MERGE INTO [your table-name] [rename your table h ...

  4. MYSQL中的主表和父表_主表,从表,关联表,父表,子表

    一.前言 在数据库设计中,Hibernate,iBatis等ORM框架的使用中经常听说主键,外键,主表,从表,关联表,父表,子表之类的术语,弄懂它们之前的区别与联系对于数据库设计和ORM框架的学习使用 ...

  5. 外链式样式表_引入CSS样式表(书写位置)

    CSS初识 CSS(Cascading Style Sheets) 美化样式 CSS通常称为CSS样式表或层叠样式表(级联样式表),主要用于设置HTML页面中的文本内容(字体.大小.对齐方式等).图片 ...

  6. mysql 事实表 维度表_数据库的事实表与维度表

    维度表示你要对数据进行分析时所用的一个量,比如你要分析产品销售情况,你可以选择按类别来进行分析,或按区域来分析,这样的按照什么分析就构成一个维度.前面的实例就可以有两个维度:类型和区域.另外每个维度还 ...

  7. excel合并多个工作表_多个工作表或者多个工作簿的合并计算

    哈喽,everybody,作为一个与excel打交道长达六年的职业老手,我会整理汇总一些十分有利于提高工作效率的小tip.也当作是我为自己知识点做的些许总结吧. 今天我们就来聊聊如何快速合并多个工作表 ...

  8. mysql 线性表_数据结构之线性表

    概要 参考<大话数据结构>,把常用的基本数据结构梳理一下. 线性表 定义 线性表(List):零个或多个数据元素的有限序列. 若将线性表记为 \((a_1, \cdots, a_{i-1} ...

  9. 什么叫做石英表_什么是石英表 石英表是什么意思

    导语:在购买手表的时候,会很多选择,比如石英表.机械表.电子表等等,对于手表不熟悉的人,会搞不清楚状况,不知道什么是石英表,下面小编为大家介绍一下什么是石英表. 什么是石英表?手表主要分为机械表.石英 ...

最新文章

  1. 打开虚拟机磁盘类型无效_[图文]VMWARE虚拟机如何打开.VMDK格式的磁盘映像
  2. [vue] vue父子组件双向绑定的方法有哪些?
  3. html表格全屏显示,tableView滑动全屏显示
  4. 使用ASP.net 2.0 的一些新特性
  5. Android:如何从堆栈中还原ProGuard混淆后的代码
  6. 「大学生学编程系列」第六篇:如何学习C语言?
  7. 在线URL转sitemap工具
  8. 嵌入式系统——面向对象的设计原则
  9. Mac Xdebug安装时遇到了Zend Engine API 不一致的问题
  10. ubuntu编译安装vim7.4
  11. iOS捷径(Workflow 2.0)拓展
  12. 最短路径系列【最短路径、哈密顿路等】
  13. MT666数字程序测试
  14. PTA创建视图,包含商品打折前后的价格信息
  15. 路由器接自己家的网络可以上网,接公司的网络不没有网络
  16. 解决win10睡眠后变卡的问题
  17. 计算机网络基础与应用复习提纲,计算机网络及应用期末复习提纲
  18. Oracle索引与where
  19. 使用markdown编辑器
  20. 如何让alias永久生效?

热门文章

  1. Java基础知识回顾之四 ----- 集合List、Map和Set
  2. C++学习笔记24,方法重写与方法隐藏
  3. MySQL增量订阅消费组件Canal POC
  4. Tomcat6 内存和线程配置
  5. SILK 的 Delay Decision 和 Dither
  6. (二)阅读器客户端开发实战_需求阐述
  7. 《适用于初学者的 Python》
  8. 零基础自学Python:安装Python、解释器、代码风格等
  9. java中的保留字_Java中的保留字是哪些呢?
  10. kali linux安装ftp服务,CentOS7安装和配置FTP