import pandas
fa=pandas.read_csv('D://Python projects//reference data//5.1//data.csv')
#查看学生分数的描述性统计结果
fa.score.describe()
#计数
fa.score.size
fa.score.max()
fa.score.min()
fa.score.sum()
#求平均值
fa.score.mean()
#求方差
fa.score.var()
#求标准差
fa.score.std()
#累计求和
fa.score.comsum()
#求最大最小值所在的序列
fa.score.argmin()
fa.score.argmax()
#RFM中大量使用到的百分位数,查找40%位置的数
fa.score.quantile(0.4,interpolation='nearest')

#分组分析
import pandas
import numpyqa=pandas.read_csv('D://Python projects//reference data//5.2//data.csv')classresult=qa.groupby(by=['class'])['score'].agg({'总分':numpy.sum,'人数':numpy.size,'平均分':numpy.mean})
#分布分析
import pandas
qb=pandas.read_csv('D://Python projects//reference data//5.3//data.csv')
#直接对年龄进行分布情况查看
qbb=qb.groupby(by=['年龄'])['年龄'].agg({'人数':numpy.size})
#通过定量分组处理数据,类似数据桶
bins=[min(qb.年龄)-1,20,40,60,80,max(qb.年龄)+1]
labels=['小于20岁','20到40岁','40到60岁','60到80岁','80岁以上']
qb['年龄分层']=pandas.cut(qb.年龄,bins,labels=labels)
#再次通过年龄分层进行分组查看
qbb=qb.groupby(by=['年龄分层'])['年龄'].agg({'人数':numpy.size})
#通过百分比的形式查看分布情况,更为直观
qbbpercent=round(qbb/qbb.sum(),4)*100
qbbpercent['人数'].map('{:,.2f}%'.format)

输出结果为:

#交叉分析(数据透视表)
qbresult=qb.pivot_table(values='年龄',index='年龄分层',columns='性别',aggfunc=[numpy.size])

#结构分析
#默认按列运算
qbresult.sum()
#设定按列运算
qbresult.sum(axis=0)
#按行运算
qbresult.sum(axis=1)
#按行求占比(按行汇总,按列除)
qbresult.div(qbresult.sum(axis=1),axis=0)
#按列求占比(按列汇总,按行除)
qbresult.div(qbresult.sum(axis=0),axis=1)

python的基本统计和分组分析和分布分析和交叉分析和结构分析相关推荐

  1. pandas分组分析:GroupBy和pandas交叉分析:pivot_table/crosstab【学习记录】

    pandas分组分析 分组分析: 根据分组字段,将分析对象划分成不同的部分,以对比分析各组之间差异性的分析方法: 分组分析常用的统计指标是计数.求和.平均值等. grouby语法: groupby(b ...

  2. 第六节 交叉分析和非参数检验

    第六节 交叉分析和非参数检验 交叉分析 交叉分析(卡方检验): 交叉分析又称为卡方检验,卡方检验的地位等同于独立样本t检验和单因素方差分析,目的也是为了研究变量之间的差异关系.是现状分析内容中的主要构 ...

  3. 问卷与量表数据分析(SPSS+AMOS)学习笔记(七) : 多选题的频率、交叉分析及卡方检验

    课程链接:<问卷与量表数据分析(SPSS+AMOS)> 笔记中的数据皆来自课程自带资料. 目录 1. 多选题的两种定义方法 1.1 定义多重响应集的步骤--二分类 1.2  定义多重响应集 ...

  4. python数据分析的交叉分析和分组分析 -第三次笔记

    python数据分析 -第三次笔记 –1.交叉分析 –2.分组分析 1.交叉分析 交叉分析的含义是在纵向分析法和横向分析法的基础上,从交叉.立体的角度出发,由浅入深.由低级到高级的一种分析方法.这种方 ...

  5. 【Python数据分析与处理 实训03】 --- 酒类消费信息分析(数据分组聚合 group().agg()应用)

    [Python数据分析与处理 实训03] - 酒类消费信息分析(数据分组聚合 group().agg()应用) 探索酒类消费信息 对于下面的数据集进行简单的一些数据的分析训练 若需要源数据请私信~ 1 ...

  6. python 密度聚类 使用_使用wgd进行全基因组复制分析

    因为全基因组复制(Whole genome duplications, WGD)是生物进化的重要因素之一, 所以WGD分析也是基因组分析经常用到的一种分析方法.举个例子,我们之所以能在多条染色体之间发 ...

  7. PYTHON黑帽编程1.5 使用WIRESHARK练习网络协议分析

    Python黑帽编程1.5  使用Wireshark练习网络协议分析 1.5.0.1  本系列教程说明 本系列教程,采用的大纲母本为<Understanding Network Hacks At ...

  8. Python数据挖掘与机器学习,快速掌握聚类算法和关联分析

    摘要:前文数据挖掘与机器学习技术入门实战与大家分享了分类算法,在本文中将为大家介绍聚类算法和关联分析问题.分类算法与聚类到底有何区别?聚类方法应在怎样的场景下使用?如何使用关联分析算法解决个性化推荐问 ...

  9. python笔记27:数据分析之交叉分析

    # -*- coding: utf-8 -*- #1.概念:交叉分析,通常用于分析两个或两个以上,分组变量之间的关系,以交叉表形式进行变量间关系的对比分析: #可以有三种情况下的交叉:定量与定量分组进 ...

最新文章

  1. [Android开发] 启程
  2. 天梯赛 L1-009 N个数求和 (20 分)
  3. OpenSSL 与 SSL 数字证书概念贴
  4. java static 变量,和方法从属于类
  5. python语言的实验心得体会_爱的五种语言——“好妈妈”培训班家教情商课课堂纪实!...
  6. 在IDEA中调试JavaScript代码
  7. 内外网同时运行路由设置
  8. iOS视频播放器MPMoviePlayerController
  9. 关于MDK调试stm32f072vbt6(HAL库)内部flash在擦除仿真时,卡死在擦除函数,同时弹出“Cannot access target.shutting down debug sessi
  10. 对自我认知四象限理解
  11. 2018.11.27 元器件选型(1)- 蜂鸣器,电池,电阻,电容,电感
  12. 生物电(ECG、EMG、EEG)科普研究
  13. 标准88 钢琴键代码 html+css+js
  14. Excel把表中一个单元格对应多个数据汇总到一个单元格内
  15. Frame-Pannel-Button综合
  16. 地图作业平台低代码实战(搭建能力提升)
  17. Flask之解读app.py文件
  18. gc日志一般关注什么_理解GC日志
  19. 苹果pencil有必要买吗?苹果平板平替电容笔推荐
  20. guess在Java中用法_guess的用法

热门文章

  1. 同城跑腿微信小程序制作步骤_分享下同城跑腿小程序的作用
  2. ZOJ1005 Jugs
  3. Unity IOS 录屏
  4. 《三国演义》中的火烧赤壁居然也是假的!!
  5. 启动docker时映射到宿主机时出现 /usr/bin/docker-current: Error response from daemon: driver failed……的解决方案
  6. 使用谷歌浏览器查看ws消息
  7. 马斯克等超1200人联名公开信呼吁:停止训练更强大的AI,这背后原因发人深省,该给ChatGPT泼冷水了
  8. python用cartopy包画地图_python绘制地图的利器Cartopy使用说明
  9. 外企8年,我学到的人性化,不止是宽容
  10. 30.kafka数据同步Elasticsearch深入详解(ES与Kafka同步)