时间序列

生成指定范围的日期,例:
pd.date_range(‘4/1/2018’,‘4/5/2018’)
‘2018-04-01’,2018-04-02’,‘2018-04-03’ …‘2018-04-05’
指定起始或者结束日期,并指定步长(单位是“日”),例:
pd.date_range(start=‘4/1/2018’,periods=5)
pd.date_range(end=‘4/5/2018’,periods=5)

将时间列设为索引,时间的标准格式对应类似于20190101这样的格式,Y为四位年,
df.date = pd.to_datetime(df.date,format="%Y%m%d")

datetime格式标准

dataFrame按时间聚合

大多标准按时间生成的数据,可以用时间作索引,pandas在时间聚合上有很好的函数应用,用得比较多的就是resample,重采样。比如以分钟为标准的数据,可以聚合成按小时的,日,月,季,或年数据,并且在后面加上mean()、sum()可以求平均值或累计值。

用日数据,按月、季、年统计平均值,例:

原数据格式


其中有一列为时间,此列在应用resample前设为索引,并转化为时间格式
resample(‘M’) 按月,resample(‘Y’)按年,resample(‘D’)按天。还有Q,按季,T按分,2T每两分钟,3M每三个月。W按周等。

#Author: Wu dongqiao  July 9, 2019
import pandas as pd
import time
path='D:\\CHB.csv'
data=pd.read_csv(path,index_col=0)  #读取数据
#将CHB列中缺失的数据线性插值
data['CHB']=round(data['CHB'].interpolate(method = 'linear', axis=0),1)
#将时间列转为时间格式
data['观测日期']=pd.to_datetime(data['观测日期'],format='%Y%m%d')
#将时间作为索引
data = data.set_index('观测日期')#保留一位小数
format1=lambda x:"%.1f"%x#按月进行平均值统计
dfM=data.resample('M').mean()
dfM[['平均气温','平均相对湿度','2M风速','CHB']]=dfM[['平均气温','平均相对湿度','2M风速','CHB']].applymap(format1)#保留一位小数
#保存月平均数据
dfM.to_csv('D:\\舒适指数月平均.csv',encoding='gbk')#按年进行统计
dfY=data.resample('Y').mean()
dfY[['平均气温','平均相对湿度','2M风速','CHB']]=dfY[['平均气温','平均相对湿度','2M风速','CHB']].applymap(format1) #保留一位小数
#保存年平均数据
dfY.to_csv('D:\\舒适指数年平均.csv',encoding='gbk')#按季进行统计
dfQ=data['1960-5':'2018-11'].resample('3M').mean()
dfQ[['平均气温','平均相对湿度','2M风速','CHB']]=dfQ[['平均气温','平均相对湿度','2M风速','CHB']].applymap(format1) #保留一位小数
dfQ.to_csv('D:\\舒适指数季平均.csv',encoding='gbk')

结果数据格式

月平均:

季平均

年平均(略)

时间值默认显示统计到间隔的最后一天。

年月日季平均运算,pandas中关于时间序列处理,resample相关推荐

  1. pandas中使用rolling.corr函数计算两个时间序列数据列之间的滚动相关性(Rolling correlations)、例如,计算两种商品销售额之间的3个月的滚动相关性

    pandas中使用rolling.corr函数计算两个时间序列数据列之间的滚动相关性(Rolling correlations).例如,计算两种商品销售额之间的3个月的滚动相关性 目录

  2. python中 zip()的使用和pandas中的列运算(map apply等)

    map()函数语法: map(function,iterable-) -> function – 函数 iterable – 一个或多个序列 案例 s1 = [1,2,3,4,5] s2 = [ ...

  3. Pandas中常见的数据运算 | 图解Pandas-图文第5篇

    01写在前面 大家好,我是阳哥,欢迎来到「Python数据之道」. 本次是<图解Pandas>系列图文内容的 第 05 篇,主要介绍 Pandas 中常见的数据运算 . 本文是付费阅读文章 ...

  4. python时间函数报错_python3中datetime库,time库以及pandas中的时间函数区别与详解...

    1介绍datetime库之前 我们先比较下time库和datetime库的区别 先说下time 在 Python 文档里,time是归类在Generic Operating System Servic ...

  5. python获取系统时间函数_python3中datetime库,time库以及pandas中的时间函数区别与详解...

    1介绍datetime库之前 我们先比较下time库和datetime库的区别 先说下time 在 Python 文档里,time是归类在Generic Operating System Servic ...

  6. Pandas中DataFrame基本函数整理(全)

    [python]Pandas中DataFrame基本函数整理(全) 构造函数 DataFrame([data, index, columns, dtype, copy]) #构造数据框 属性和数据 D ...

  7. Pandas 中 Series 和 DataFrame 知识点

    Series Series对象的创建 # pandas 学习 import pandas as pd from pandas import Series,DataFrame import numpy ...

  8. python量化交易pandas中的用途

    Pandas 是一个重要的数据处理和分析库,它提供了许多功能强大的数据结构和函数,可以帮助我们在期货量化交易中进行数据清洗 目录: 1.读取和写入数据 2.数据清洗和预处理-1 3.数据分组和聚合 4 ...

  9. Python金融大数据分析:用pandas处理金融时间序列数据的基础知识

    时间是阻止所有事情同时发生的力量.--雷•卡明斯 本节使用的是以CSV文件形式在本地存储的金融数据集形式为本地存储的CSV文件.从技术上讲,CSV文件是包含数据行结构的文本文件,其特征是以逗号分隔单个 ...

最新文章

  1. Android中几种常用的定时器和延时方法
  2. ASP.NET 网站路径[转载]
  3. PyCharm的配置与安装
  4. Nordic nRF5 SDK和softdevice介绍
  5. 使用观察者模式在 Silverlight 中切换用户控件
  6. 三层设计模式初步分离
  7. 利用Excel或LibreOffice的业务输入进行单元测试约束
  8. 知道创宇杨冀龙:2B产品经理的自我修养
  9. Cloud Native Weekly|2019欧洲KubeCon成功闭幕
  10. QT5开发及实例学习之四容器类
  11. 为什么电脑能随便重装系统,而手机刷机可能刷成砖?
  12. 生成一定数量的不重复随机数
  13. matlab 7.0安装教程
  14. 408考研复试之计算机组成原理笔记第一二三章
  15. 鼠标计算机英语怎么说,鼠标英语
  16. python绘制指数函数图像及性质_python实现画出e指数函数的图像
  17. 性能调优之JMH必知必会1:什么是JMH
  18. Tech Talk 活动回顾|基于 Amazon KVS 打造智能视觉产品
  19. 仿宋GB213字体加粗后笔画发虚
  20. puppy linux 默认密码,puppylinux使用手册.doc

热门文章

  1. LeetCode 805数组切割题目
  2. 如何在控制台创建文件夹
  3. UIswitch 的用法
  4. 快速下载官方网站软件
  5. Java线程池「异常处理」正确姿势:有病就得治
  6. linux|shell脚本|有趣的知识---格式化输出日志和脚本调试方法以及kubernetes集群核心服务重启和集群证书备份脚本
  7. 抢购倒计时自定义控件的实现与优化
  8. 在线教育如何做好直播?
  9. 微信公众号中的支付宝支付与微信支付 支付宝支付问题(微信bug)
  10. 机器视觉算法工程师试题