Python数据处理案例
关于数据处理案例有两个,第一个案例是我整理到有道云上的,就直接剪切下来了,下面直接进入正题~
案例1:快餐数据
案例2:欧洲杯数据
先进行数据探索
data.info()data.describe()
查看数据集是否有缺失值且哪个字段存在缺失值?可以用下面的代码,也可以用前面案例1缺失值那里提到的前两种方法
for i in range(data.shape[1]):if data.iloc[:,i].notnull().sum() != data.shape[0]:print('第%d列:字段%s 存在缺失值'%(i+1,data.columns[i]))
代码运行结果是
对Clearances off line进行缺失值处理
首先查看Clearances off line字段
统计其数字组成
data['Clearances off line'].value_counts()
从统计结果可以看到,在Clearances off line这个字段中有11个值为0,3个值为1,1个值为2,故考虑采用众数(mode)填充缺失值
mode=data['Clearances off line'].mode()
data['Clearances off line']=data['Clearances off line'].fillna(mode)
描述性统计
统计有多少球队参加了欧洲杯?
data.Team.count()
将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框
discipline=data[['Team','Yellow Cards','Red Cards']]
按照先Red Cards再Yellow Cards进行降序排序
discipline.sort_values(by=['Red Cards','Yellow Cards'])
计算每个球队拿到黄牌的平均值
data['Yellow Cards'].mean()
找出进球数大于6个的球队的数据
data[data['Goals']>6]
对比英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)
data['Shooting Accuracy'].[data.Team.isin(['England','ltaly','Russia'])]
Python数据处理案例相关推荐
- Python之数据处理案例
Python之数据处理案例 1 准备数据 2 要求 (1)将数据表添加两列:每位同学的各科成绩总分(score)和每位同学的整体情况(类别),类别按照[df.score.min()-1,400,450 ...
- python数据比对怎么做_同事给你迷之Excel数据,4个数据处理案例教你Python数据对比更新...
经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死.后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器-- pandas 前言 有时候我们需要 ...
- Python小案例(一)非结构化文本数据处理
Python小案例(一)非结构化文本数据处理 日常业务需求中,仅凭SQL一招鲜是没法吃遍天的,这个时候就需要更为强大的Python进行支持了.这个系列主要分享一些Python小案例,都是根据笔者日常工 ...
- insert into 多条数据_最全总结 | 聊聊 Python 数据处理全家桶(Sqlite篇)
点击上方"AirPython",选择"加为星标" 第一时间关注 Python 技术干货! 1. 前言 上篇文章 聊到 Python 处理 Mysql 数据库最常 ...
- 【分类算法】Logistic算法原理、标准评分卡开发流程、python代码案例
[博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/sunyaowu315/article/details/ ...
- Python 数据处理函数 round()、int()、floor()、ceil()的用法
对每位程序员来说,在编程过程中数据处理是不可避免的,很多时候都需要根据需求把获取到的数据进行处理,取整则是最基本的数据处理.取整的方式则包括向下取整.四舍五入.向上取整等等 向下取整:int() 四舍 ...
- 太赞了!用200道题彻底搞定Python数据处理!
前言 Pandas与NumPy都是Python数据分析中的利器,但是对着官方文档学习是十分枯燥且低效的方式,因此我精心挑选了200个Python数据处理中的常用操作,并整理成习题的形式创作了Panda ...
- python数据分析案例-利用生存分析Kaplan-Meier法与COX比例风险回归模型进行客户流失分析与剩余价值预测
目录 1. 概述 1.1 背景 1.2 目的 1.3 数据说明 2. 相关概念 2.1 事件 2.2 生存时间 2.3 删失 2.4 生存概率 2.5 中位生存时间 2.6 风险概率 3. 数据处理 ...
- Python实战案例:旅游方面博文的数据分析
Python实战案例:旅游方面博文的数据分析 一.旅游方面博文数据展示 数据分析的出现便利了每个人,企业,竞争者.在以前的时候,如果想要了解市场的动向,就设计了调查问卷或者现场采访的方式,以至于被很多 ...
最新文章
- apache 安装与配置详细教程
- yolov5组件笔记
- 时间段为查询条件时的日期边界查询不到问题
- PHP常用 header函数设置HTTP头部示例
- 从一个实例看javascript几种常用格式的转换
- 设计模式-工厂方法(Factory Method)
- [剑指offer]面试题16:反转链表
- python一图带你精通time类型转换
- XXX packages are looking for funding run `npm fund` for details
- Python不使用int()函数把字符串转换为数字
- ztree实现节点事件
- ACM动态规划总结(by utobe67)
- VB6 用ODBC连接数据库
- 迪杰斯算法c语言,欧博体育APP-欧博体育APP
- 机器学习(1)泛化误差上界的实现及分析
- 最近非常火的电子木鱼流量主小程序源码
- 计算机分子模拟聚乙烯,高分子物理实验思考题@中科大.pdf
- 什么是浮点型?什么是单精度浮点数(float)以及双精度浮点数(double)?
- js对象新增方法object.assign()
- kali linux网络扫描~网络扫描
热门文章
- 聚焦“数字中国” | 以“云智原生”为基石,激发数字化创新红利
- 新华三交换机基于MAC的vlan划分
- 多个PDF文件怎么合并?PDF合并的方法教程
- python学多久可以考二级建造师吗_没有基础。学多久能过二级建造师
- 传统产业如何进行数字化转型
- 游承超:钢化玻璃膜既保护屏幕又不影响触感(4P)
- 你拥有的知识比你想象中更有意义和价值
- android 代码 lut,如何将颜色LUT应用于位图图像以获取android中的滤镜效果?
- iOS从相册选择视频和保存视频到相册
- 华为梁华:鸿蒙系统不是谈判策略 是针对IoT的操作系统