pandas时间处理操作
时间操作
在机器学习建模中,从始至终都是尽可能多地利用数据所提供的信息,当然时间特征也不例外。当拿到一份时间特征时,最好还是将其转换成标准格式,这样在提取特征时更方便一些∶
时间特征只需要满足标准格式就可以调用各种函数和属性了,上述操作通过时间提取了当前具体的年、月、日等指标。
一旦转换成标准格式,注意其dtype类型,就可以调用各种属性进行统计分析了∶
如果数据中没有给定具体的时间特征,也可以自己来创建,例如知道数据的采集时间,并且每条数据都是固定时间间隔保存下来的∶
读取数据时,如果想以时间特征为索引,可以将 parse dates 参数设置为 True∶
有了索引后,就可以用它来取数据啦∶
也用 data【'2012-01’∶2012-03】指定具体月份,或者更细致一些,在小时上继续进行判断,如data【(data. index.hour > 8) &(data.index.hour <12)]。
下面再介绍一个重量级的家伙,在处理时间特征时候经常会用到它——resample重采样,先来看看执行结果∶
原始数据中每天都有好几条数据,但是这里想统计的是每天的平均指标,当然也可以计算其最大值、最小值,只需把 .mean()换成 .max()或者.min()即可。
例如想按 3天为一个周期进行统计∶
按月进行统计也是同理∶
时间数据可以提取出非常丰富的特征,不仅有年、月、日等常规指标,还可以判断是否是周末、工作日、上下旬、上下班时间、节假日等特征,这些特征对数据挖掘任务都是十分有帮助的。
pandas时间处理操作相关推荐
- python时间处理模块datetime+dateutil、numpy时间处理模块datetime64以及pandas时间处理模块Timestamp的演化路径及常用处理接口
python时间处理模块datetime+dateutil.numpy时间处理模块datetime64以及pandas时间处理模块Timestamp及常用处理接口 python时间处理模块dateti ...
- Pandas数据类型及操作
Pandas数据类型及操作,pandas 提供了一组标准的时间序列处理工具和数据算法 数据类型及操作 Python 标准库的 datetime datetime 模块中的 datetime. time ...
- 数据导入与预处理-拓展-pandas时间数据处理01
数据导入与预处理-拓展-pandas时间数据处理01 Pandas时序数据系列博客 Pandas时间序列数据处理 1.好用的Python库 2.Pandas历史 3.时序数据处理 3.1 时序中的基本 ...
- WPF窗口长时间无人操作鼠标自动隐藏
原文:WPF窗口长时间无人操作鼠标自动隐藏 在软件开发中有时会有等待一段时间无人操作后隐藏鼠标,可能原因大致如下: 1.为了安全性,特别是那些需要用到用户名和密码登录服务端的程序,常常考虑长期无人操作 ...
- 数据分析工具Pandas(2):Pandas的索引操作
数据分析工具Pandas(1):Pandas的数据结构 数据分析工具Pandas(2):Pandas的索引操作 Pandas的索引操作 索引对象Index 1. Series和DataFrame中的索 ...
- MYSQL连接一段时间不操作后出现异常的解决方案
MYSQL连接一段时间不操作后出现异常的解决方案 参考文章: (1)MYSQL连接一段时间不操作后出现异常的解决方案 (2)https://www.cnblogs.com/bokejiayuan/p/ ...
- c 获取当前时间插入oracle数据库,Oracle如何获取系统当前时间等操作实例,c++获取系统时间...
Oracle如何获取系统当前时间等操作实例,c++获取系统时间 获取系统当前时间 date类型的 select sysdate from dual; char类型的 select to_char(sy ...
- Pandas简明教程:五、Pandas简单统计操作及通用方式
文章目录 1.DataFrame的方法使用举例 2.DataFrame的方法调用通用方式 3.DataFrame直接调用其它方法 本系列教程教程完整目录: 前面已经提到,Pandas的DataFram ...
- oracle sql比较时间大小,Oracle数据库中日期时间的操作比较和加减
Oracle数据库中日期时间的操作比较和加减 Oracle关于时间/日期的操作 1.日期时间间隔操作 当前时间减去7分钟的时间 select sysdate,sysdate - interval '7 ...
最新文章
- Win7系统下Vmware虚拟机无法使用USB设备问题的解决方法
- Java(15) _Runtime类 内存方法
- keil环境下stm32下载和擦除程序对Flash的影响
- 区块链BaaS云服务(17)纸贵科技Z-BaaS“合约中心”
- 二十一、String、StringBuffer和StringBuilder的区别是什么?
- 2019蓝桥杯省赛---java---B---4(数的分解)
- css 透明度_如何使用CSS实现精美视频片头制作
- 美图回应与华为合作:华为没有使用美图的任何影像技术
- 工业品器械设备怎么做宣传和推广?
- matlab仿真电子秤,基于单片机的电子秤设计
- python图书馆系统借书验证登陆功能
- STL-造汽车的厂家不造轮子
- qt4谷歌输入法 linux,linux mint设置google pinyin输入法
- python绘制彩色地震剖面断层解释_断层在地震剖面上的反映及解释
- Android时间与服务器同步方案
- win10系统连接wifi后可以上网但是显示【无Internet,安全】解决 and Maple初始化失败问题
- spi转串口 linux驱动,RT_Thread WK2124 SPI转串口芯片驱动软件包
- NLP面试宝典:38个最常见NLP问题答案一文get
- Android产品研发(十)--尽量不使用静态变量保存数据
- 近期接触到大数据业务,速上地图采集器图文教程仅供参考
热门文章
- 对计算机上的浏览器的介绍,挖掘IE浏览器的潜在功能(一) -电脑资料
- 编写一个学生类 student,包含的属性有学号、姓名年龄,将所有学生存储在一个数组中
- python两个一维数组合并_python:16.合并两个排序的链表
- 5折交叉验证_交叉验证的方法主要分为哪些?
- html大气网页模板,HTML蓝色大气形式扁平企业官网网页模板代码
- mysql 触发器 for each row 理解_MySQL触发器中的“ FOR EACH ROW”如何工作?
- vue 父向子组件传递数据,子组件向父组件传递数据方式
- 题解 POJ 2559-SP1805 【HISTOGRA - Largest Rectangle in a Histogram】
- DSP5509的GPIO学习-第5篇
- 手动创建Oracle实例