数学建模美赛大数据题必须要会的数据预处理操作(二)!!!

文章目录

  • 数学建模美赛大数据题必须要会的数据预处理操作(二)!!!
  • 创建DataFrame
    • 数据显示限制
  • Series操作
    • 创建Series
    • 查找
    • 修改
    • 修改索引
    • 增加数据
    • 删除操作

这里以2020年美赛C题为例,用实战进行数据处理的学习。

其数据已经上传到了这里,可以自行下载:数学建模美赛2020C题数据以及优秀o奖论文

创建DataFrame



数据显示限制


由于设置了display.max rows=6,因此只显示其中6条数据,其余省略了。


如果数据特征稍微有点多,可以设置得更大一些∶


Series操作

前面提到的操作对象都是 DataFrame,那么 Series 又是什么呢? 简单来说,读取的数据都是二维的,也就是 DataFrame;如果在数据中单独取某列数据,那就是 Series格式了,相当于DataFrame是由Series组合起来得到的,因而更高级一些。

创建Series

查找

修改


迪哥说∶注意,replace()函数的参数中多了一项inplace,也可以试试将其设置为 False,看看结果会怎样。之前也强调过,如果设置 inplace=False,就是不将结果赋值给变量,只相当于打印操作;如果设置 inplace=True,就是直接在数据中执行实际变换,而不仅是打印操作。

修改索引


增加数据


增操作既可以把之前的数据增加进来,也可以增加新创建的数据。但是感觉增加完数据之后,索引有怪怪的,既然数据重新组合到一起了,也应该把索引重新制作一下,可以在append函数中指定ignore_index True 参数来重新设置索引,结果如下∶

删除操作

这只是一部分,新一部分马上就出,欢迎关注

  • 数学建模博客专栏
  • 数据分析专栏
  • Python基础专栏
  • 机器学习专栏
  • 深度学习专栏

大数据分析必须要会的数据预处理操作(二)!!!相关推荐

  1. 大数据分析必须要会的数据预处理操作(一)!!!

    数学建模美赛大数据题必须要会的数据预处理操作(一)!!! 文章目录 数学建模美赛大数据题必须要会的数据预处理操作(一)!!! pandas基础函数 读取并查看 DataFrame结构 info() 返 ...

  2. 手把手教你EEG脑电数据预处理-操作篇

    目录 导入数据 对数据进行初步认识 电极定位 移除无用电极 重参考 重采样 滤波 分段和基线校正 插值坏导 ICA 剔除ICA成分 剔除坏段 目视检查法 保存数据 本分享为脑机学习者Rose整理发表于 ...

  3. python如何清空excel表格_python 删除excel表格重复行,数据预处理操作

    使用python删除excel表格重复行. # 导入pandas包并重命名为pd import pandas as pd # 读取Excel中Sheet1中的数据 data = pd.DataFram ...

  4. 使用MapReduce程序完成相关数据预处理(二)

    使用MapReduce程序完成相关数据预处理(二) 数据大概有2万条左右所以部分截取 (格式为csv) 1月20日,北京,大兴区,2,0,0,北京市大兴区卫健委,https://m.weibo.cn/ ...

  5. 数据分析与挖掘-python常用数据预处理函数

    数据预处理往往在数据分析和数据挖掘领域占到了很大的比重,甚至在机器学习这些海量数据处理的场合,数据预处理也是最核心的工作.介绍几个预处理阶段常用的库函数. 1.interpolate 插值函数,Sci ...

  6. [Pyhon疫情大数据分析] 一.腾讯实时数据爬取、Matplotlib和Seaborn可视化分析全国各地区、某省各城市、新增趋势

    思来想去,虽然很忙,但还是挤时间针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫.可视化分析.GIS地图显示.情感分析.舆情分析.主题挖掘.威胁情报溯源.知识图谱.预测预警及AI和NL ...

  7. 大数据分析必须要会的python函数操作!!!

    数学建模美赛大数据分析题必须要会的python函数操作!!! 这里以2020年美赛C题为例,用实战进行数据处理的学习. 其数据已经上传到了这里,可以自行下载:数学建模美赛2020C题数据以及优秀o奖论 ...

  8. 《数据分析》(一) ———— 数据基础操作

    数据分析学习(一) ---- 数据基础操作 基于Python的数据分析实战学习 本次数据分析的学习以kaggle上泰坦尼克项目着手,通过完成数据分析实战项目全流程,熟悉数据分析. 数据分析流程大致为三 ...

  9. 专栏 | 基于 Jupyter 的特征工程手册:数据预处理(二)

    作者:陈颖祥.杨子晗 编译:AI有道 基于 Jupyter 的特征工程手册:数据预处理的上一篇: 专栏 | 基于 Jupyter 的特征工程手册:数据预处理(一) 项目地址: https://gith ...

最新文章

  1. distributed processing(分布式处理)
  2. SpringCloud环境搭建
  3. ESP8266在Alios-Things上的入门开发指南 (一)开发环境搭建及HelloWorld固件
  4. server2003 IIS6.0 网站不可用
  5. maven 配置环境变量
  6. glassfish 是oracle的,GlassFish“百天”小版本 彰显Oracle的大功力
  7. 3dmax 导出 fbx文件, 模型 到Unity中 贴图丢失
  8. GT540M最新驱动(windows XP 32位),安装NDIVIA安装程序无法继续解决方法
  9. diy计算机组装注意事项,电脑DIY常见误区有哪些 电脑组装新手注意事项
  10. 排序算法7——图解快速排序(两种主元选择方法)以及CUTOFF时间测试
  11. kindle paperwhite2 越狱备忘
  12. 查询主机序列号/基本信息
  13. 深圳人行推出企业信用报告网银查询渠道
  14. uni-app 省市区选择器
  15. python----引用其他py文件中的函数
  16. vue中下载文件导出保存到本地
  17. 安装torch0.4.1的神坑
  18. APP在后台被系统杀死的六种主要原因
  19. EPICS工具CSS学习笔记
  20. 如何替换一个Linux内核函数的实现-热补丁原理

热门文章

  1. oracle11查看dblink,配置oracle11g通过dblink+透明网关访问GBase
  2. html5 心跳效果,css3实现心脏跳动
  3. hibernateTemplate update 修改指定字段
  4. Oracle 实验6 PL/SQL编程
  5. ssis包部署提示不能与集成身份验证一起使用_何时使用和不使用云原生安全工具...
  6. java 对象结构_java对象的结构
  7. 如何查看2012服务器登录日志文件,怎样查看2012服务器远程过记录
  8. Golang Tips
  9. NOIP2011 选择客栈(洛谷P1311)
  10. 数据库 数据库编程二