关于数据处理案例有两个,第一个案例是我整理到有道云上的,就直接剪切下来了,下面直接进入正题~

案例1:快餐数据

案例2:欧洲杯数据

先进行数据探索

data.info()data.describe()

查看数据集是否有缺失值且哪个字段存在缺失值?可以用下面的代码,也可以用前面案例1缺失值那里提到的前两种方法

for i in range(data.shape[1]):if data.iloc[:,i].notnull().sum() != data.shape[0]:print('第%d列:字段%s 存在缺失值'%(i+1,data.columns[i]))

代码运行结果是

对Clearances off line进行缺失值处理

首先查看Clearances off line字段

统计其数字组成

data['Clearances off line'].value_counts()

从统计结果可以看到,在Clearances off line这个字段中有11个值为0,3个值为1,1个值为2,故考虑采用众数(mode)填充缺失值

mode=data['Clearances off line'].mode()
data['Clearances off line']=data['Clearances off line'].fillna(mode)

描述性统计

统计有多少球队参加了欧洲杯?

data.Team.count()

将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框

discipline=data[['Team','Yellow Cards','Red Cards']]

按照先Red Cards再Yellow Cards进行降序排序

discipline.sort_values(by=['Red Cards','Yellow Cards'])

计算每个球队拿到黄牌的平均值

data['Yellow Cards'].mean()

找出进球数大于6个的球队的数据

data[data['Goals']>6]

对比英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)

data['Shooting Accuracy'].[data.Team.isin(['England','ltaly','Russia'])]

Python数据处理案例相关推荐

  1. Python之数据处理案例

    Python之数据处理案例 1 准备数据 2 要求 (1)将数据表添加两列:每位同学的各科成绩总分(score)和每位同学的整体情况(类别),类别按照[df.score.min()-1,400,450 ...

  2. python数据比对怎么做_同事给你迷之Excel数据,4个数据处理案例教你Python数据对比更新...

    经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死.后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器-- pandas 前言 有时候我们需要 ...

  3. Python小案例(一)非结构化文本数据处理

    Python小案例(一)非结构化文本数据处理 日常业务需求中,仅凭SQL一招鲜是没法吃遍天的,这个时候就需要更为强大的Python进行支持了.这个系列主要分享一些Python小案例,都是根据笔者日常工 ...

  4. insert into 多条数据_最全总结 | 聊聊 Python 数据处理全家桶(Sqlite篇)

    点击上方"AirPython",选择"加为星标" 第一时间关注 Python 技术干货! 1. 前言 上篇文章 聊到 Python 处理 Mysql 数据库最常 ...

  5. 【分类算法】Logistic算法原理、标准评分卡开发流程、python代码案例

    [博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/sunyaowu315/article/details/ ...

  6. Python 数据处理函数 round()、int()、floor()、ceil()的用法

    对每位程序员来说,在编程过程中数据处理是不可避免的,很多时候都需要根据需求把获取到的数据进行处理,取整则是最基本的数据处理.取整的方式则包括向下取整.四舍五入.向上取整等等 向下取整:int() 四舍 ...

  7. 太赞了!用200道题彻底搞定Python数据处理!

    前言 Pandas与NumPy都是Python数据分析中的利器,但是对着官方文档学习是十分枯燥且低效的方式,因此我精心挑选了200个Python数据处理中的常用操作,并整理成习题的形式创作了Panda ...

  8. python数据分析案例-利用生存分析Kaplan-Meier法与COX比例风险回归模型进行客户流失分析与剩余价值预测

    目录 1. 概述 1.1 背景 1.2 目的 1.3 数据说明 2. 相关概念 2.1 事件 2.2 生存时间 2.3 删失 2.4 生存概率 2.5 中位生存时间 2.6 风险概率 3. 数据处理 ...

  9. Python实战案例:旅游方面博文的数据分析

    Python实战案例:旅游方面博文的数据分析 一.旅游方面博文数据展示 数据分析的出现便利了每个人,企业,竞争者.在以前的时候,如果想要了解市场的动向,就设计了调查问卷或者现场采访的方式,以至于被很多 ...

最新文章

  1. apache 安装与配置详细教程
  2. yolov5组件笔记
  3. 时间段为查询条件时的日期边界查询不到问题
  4. PHP常用 header函数设置HTTP头部示例
  5. 从一个实例看javascript几种常用格式的转换
  6. 设计模式-工厂方法(Factory Method)
  7. [剑指offer]面试题16:反转链表
  8. python一图带你精通time类型转换
  9. XXX packages are looking for funding run `npm fund` for details
  10. Python不使用int()函数把字符串转换为数字
  11. ztree实现节点事件
  12. ACM动态规划总结(by utobe67)
  13. VB6 用ODBC连接数据库
  14. 迪杰斯算法c语言,欧博体育APP-欧博体育APP
  15. 机器学习(1)泛化误差上界的实现及分析
  16. 最近非常火的电子木鱼流量主小程序源码
  17. 计算机分子模拟聚乙烯,高分子物理实验思考题@中科大.pdf
  18. 什么是浮点型?什么是单精度浮点数(float)以及双精度浮点数(double)?
  19. js对象新增方法object.assign()
  20. kali linux网络扫描~网络扫描

热门文章

  1. 聚焦“数字中国” | 以“云智原生”为基石,激发数字化创新红利
  2. 新华三交换机基于MAC的vlan划分
  3. 多个PDF文件怎么合并?PDF合并的方法教程
  4. python学多久可以考二级建造师吗_没有基础。学多久能过二级建造师
  5. 传统产业如何进行数字化转型
  6. 游承超:钢化玻璃膜既保护屏幕又不影响触感(4P)
  7. 你拥有的知识比你想象中更有意义和价值
  8. android 代码 lut,如何将颜色LUT应用于位图图像以获取android中的滤镜效果?
  9. iOS从相册选择视频和保存视频到相册
  10. 华为梁华:鸿蒙系统不是谈判策略 是针对IoT的操作系统