大数据分析必须要会的数据预处理操作(二)!!!
数学建模美赛大数据题必须要会的数据预处理操作(二)!!!
文章目录
- 数学建模美赛大数据题必须要会的数据预处理操作(二)!!!
- 创建DataFrame
- 数据显示限制
- Series操作
- 创建Series
- 查找
- 修改
- 修改索引
- 增加数据
- 删除操作
这里以2020年美赛C题为例,用实战进行数据处理的学习。
其数据已经上传到了这里,可以自行下载:数学建模美赛2020C题数据以及优秀o奖论文
创建DataFrame
数据显示限制
由于设置了display.max rows=6,因此只显示其中6条数据,其余省略了。
如果数据特征稍微有点多,可以设置得更大一些∶
Series操作
前面提到的操作对象都是 DataFrame,那么 Series 又是什么呢? 简单来说,读取的数据都是二维的,也就是 DataFrame;如果在数据中单独取某列数据,那就是 Series格式了,相当于DataFrame是由Series组合起来得到的,因而更高级一些。
创建Series
查找
修改
迪哥说∶注意,replace()函数的参数中多了一项inplace,也可以试试将其设置为 False,看看结果会怎样。之前也强调过,如果设置 inplace=False,就是不将结果赋值给变量,只相当于打印操作;如果设置 inplace=True,就是直接在数据中执行实际变换,而不仅是打印操作。
修改索引
增加数据
增操作既可以把之前的数据增加进来,也可以增加新创建的数据。但是感觉增加完数据之后,索引有怪怪的,既然数据重新组合到一起了,也应该把索引重新制作一下,可以在append函数中指定ignore_index True 参数来重新设置索引,结果如下∶
删除操作
这只是一部分,新一部分马上就出,欢迎关注
- 数学建模博客专栏
- 数据分析专栏
- Python基础专栏
- 机器学习专栏
- 深度学习专栏
大数据分析必须要会的数据预处理操作(二)!!!相关推荐
- 大数据分析必须要会的数据预处理操作(一)!!!
数学建模美赛大数据题必须要会的数据预处理操作(一)!!! 文章目录 数学建模美赛大数据题必须要会的数据预处理操作(一)!!! pandas基础函数 读取并查看 DataFrame结构 info() 返 ...
- 手把手教你EEG脑电数据预处理-操作篇
目录 导入数据 对数据进行初步认识 电极定位 移除无用电极 重参考 重采样 滤波 分段和基线校正 插值坏导 ICA 剔除ICA成分 剔除坏段 目视检查法 保存数据 本分享为脑机学习者Rose整理发表于 ...
- python如何清空excel表格_python 删除excel表格重复行,数据预处理操作
使用python删除excel表格重复行. # 导入pandas包并重命名为pd import pandas as pd # 读取Excel中Sheet1中的数据 data = pd.DataFram ...
- 使用MapReduce程序完成相关数据预处理(二)
使用MapReduce程序完成相关数据预处理(二) 数据大概有2万条左右所以部分截取 (格式为csv) 1月20日,北京,大兴区,2,0,0,北京市大兴区卫健委,https://m.weibo.cn/ ...
- 数据分析与挖掘-python常用数据预处理函数
数据预处理往往在数据分析和数据挖掘领域占到了很大的比重,甚至在机器学习这些海量数据处理的场合,数据预处理也是最核心的工作.介绍几个预处理阶段常用的库函数. 1.interpolate 插值函数,Sci ...
- [Pyhon疫情大数据分析] 一.腾讯实时数据爬取、Matplotlib和Seaborn可视化分析全国各地区、某省各城市、新增趋势
思来想去,虽然很忙,但还是挤时间针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫.可视化分析.GIS地图显示.情感分析.舆情分析.主题挖掘.威胁情报溯源.知识图谱.预测预警及AI和NL ...
- 大数据分析必须要会的python函数操作!!!
数学建模美赛大数据分析题必须要会的python函数操作!!! 这里以2020年美赛C题为例,用实战进行数据处理的学习. 其数据已经上传到了这里,可以自行下载:数学建模美赛2020C题数据以及优秀o奖论 ...
- 《数据分析》(一) ———— 数据基础操作
数据分析学习(一) ---- 数据基础操作 基于Python的数据分析实战学习 本次数据分析的学习以kaggle上泰坦尼克项目着手,通过完成数据分析实战项目全流程,熟悉数据分析. 数据分析流程大致为三 ...
- 专栏 | 基于 Jupyter 的特征工程手册:数据预处理(二)
作者:陈颖祥.杨子晗 编译:AI有道 基于 Jupyter 的特征工程手册:数据预处理的上一篇: 专栏 | 基于 Jupyter 的特征工程手册:数据预处理(一) 项目地址: https://gith ...
最新文章
- distributed processing(分布式处理)
- SpringCloud环境搭建
- ESP8266在Alios-Things上的入门开发指南 (一)开发环境搭建及HelloWorld固件
- server2003 IIS6.0 网站不可用
- maven 配置环境变量
- glassfish 是oracle的,GlassFish“百天”小版本 彰显Oracle的大功力
- 3dmax 导出 fbx文件, 模型 到Unity中 贴图丢失
- GT540M最新驱动(windows XP 32位),安装NDIVIA安装程序无法继续解决方法
- diy计算机组装注意事项,电脑DIY常见误区有哪些 电脑组装新手注意事项
- 排序算法7——图解快速排序(两种主元选择方法)以及CUTOFF时间测试
- kindle paperwhite2 越狱备忘
- 查询主机序列号/基本信息
- 深圳人行推出企业信用报告网银查询渠道
- uni-app 省市区选择器
- python----引用其他py文件中的函数
- vue中下载文件导出保存到本地
- 安装torch0.4.1的神坑
- APP在后台被系统杀死的六种主要原因
- EPICS工具CSS学习笔记
- 如何替换一个Linux内核函数的实现-热补丁原理
热门文章
- oracle11查看dblink,配置oracle11g通过dblink+透明网关访问GBase
- html5 心跳效果,css3实现心脏跳动
- hibernateTemplate update 修改指定字段
- Oracle 实验6 PL/SQL编程
- ssis包部署提示不能与集成身份验证一起使用_何时使用和不使用云原生安全工具...
- java 对象结构_java对象的结构
- 如何查看2012服务器登录日志文件,怎样查看2012服务器远程过记录
- Golang Tips
- NOIP2011 选择客栈(洛谷P1311)
- 数据库 数据库编程二