移动窗口和指数加权函数类别如↓:

rolling_mean 移动窗口的均值
pandas.rolling_mean(arg, window, min_periods=None, freq=None, center=False, how=None, **kwargs)

rolling_median 移动窗口的中位数
pandas.rolling_median(arg, window, min_periods=None, freq=None, center=False, how=‘median’, **kwargs)

rolling_var 移动窗口的方差
pandas.rolling_var(arg, window, min_periods=None, freq=None, center=False, how=None, **kwargs)

rolling_std 移动窗口的标准差
pandas.rolling_std(arg, window, min_periods=None, freq=None, center=False, how=None, **kwargs)

rolling_min 移动窗口的最小值
pandas.rolling_min(arg, window, min_periods=None, freq=None, center=False, how=‘min’, **kwargs)

rolling_max 移动窗口的最大值
pandas.rolling_min(arg, window, min_periods=None, freq=None, center=False, how=‘min’, **kwargs)

rolling_corr 移动窗口的相关系数
pandas.rolling_corr(arg1, arg2=None, window=None, min_periods=None, freq=None, center=False, pairwise=None, how=None)

rolling_corr_pairwise 配对数据的相关系数
等价于: rolling_corr(…, pairwise=True)
pandas.rolling_corr_pairwise(df1, df2=None, window=None, min_periods=None, freq=None, center=False)

rolling_cov 移动窗口的协方差
pandas.rolling_cov(arg1, arg2=None, window=None, min_periods=None, freq=None, center=False, pairwise=None, how=None, ddof=1)

rolling_skew 移动窗口的偏度(三阶矩)
pandas.rolling_skew(arg, window, min_periods=None, freq=None, center=False, how=None, **kwargs)

rolling_kurt 移动窗口的峰度(四阶矩)
pandas.rolling_kurt(arg, window, min_periods=None, freq=None, center=False, how=None, **kwargs)

rolling_apply 对移动窗口应用普通数组函数
pandas.rolling_apply(arg, window, func, min_periods=None, freq=None, center=False, args=(), kwargs={})

rolling_window 移动窗口
pandas.rolling_window(arg, window=None, win_type=None, min_periods=None, freq=None, center=False, mean=True, axis=0, how=None, **kwargs)

ewma 指数加权移动
ewma(arg[, com, span, halflife, …])

ewmstd 指数加权移动标准差
ewmstd(arg[, com, span, halflife, …])

ewmvar 指数加权移动方差
ewmvar(arg[, com, span, halflife, …])

ewmcorr 指数加权移动相关系数
ewmcorr(arg1[, arg2, com, span, halflife, …])

ewmcov 指数加权移动协方差
ewmcov(arg1[, arg2, com, span, halflife, …])

  1. rolling_系列是pandas的函数,不是DataFrame或Series对象的方法,其格式为pd.rolling_mean(D,k),其中每k列计算一次平均值,滚动计算。
  2. 新版用DataFrame.rolling(...).mean()取代了pd.rolling_mean(DataFrame,...)

1. 简单移动平均

  在移动窗口上计算的各种统计函数也是一类常见于时间序列的数组变换。我们将他们称谓移动窗口函数-moving window function其中还包括那些窗口不定长的函数,跟其他函数一样,移动窗口会自动排除缺失值。

DataFrame.rolling(window, min_periods=None, center=False, win_type=None, on=None, axis=0, closed=None)
  1. window: 也可以省略不写。表示时间窗的大小,注意有两种形式(int or offset)。如果使用int,则数值表示计算统计量的观测值的数量即向前几个数据。如果是offset类型,表示时间窗的大小。offset详解
  2. min_periods:每个窗口最少包含的观测值数量,小于这个值的窗口结果为NA。值可以是int,默认None。offset情况下,默认为1。
  3. center: 把窗口的标签设置为居中。布尔型,默认False,居右
  4. win_type: 窗口的类型。截取窗的各种函数。字符串类型,默认为None。各种类型
  5. on: 可选参数。对于dataframe而言,指定要计算滚动窗口的列。值为列名。
  6. axis: int、字符串,默认为0,即对列进行计算
  7. closed:定义区间的开闭,支持int类型的window。对于offset类型默认是左开右闭的即默认为right。可以根据情况指定为left both等。

举例1:对Series格式数据,滑动窗口设置为5

  对DataFrame格式数据,滑动窗口设置为2

举例2:简单移动平均

  简单移动平均(Simple Moving Average, SMA)就是对时间序列直接求等权重均值,因此使用简单。但其最令人诟病的就是它的滞后性。从上图不难看出,随着计算窗口   的增大,移动平均线越来越平滑,但同时也越来越滞后。以 120 日均线为例,在 2015 年 6 月份之后的大熊市开始了很长一段时间之后,120 日均线才开始呈现下降趋势。如果我们按照这个趋势进行投资,那这个滞后无疑造成了巨额的亏损。

举例3:加权移动平均

  以上证指数过去 10 年的日数据为例,下图比较了  时的简单移动平均和加权移动平均的过滤效果。加权移动平均比简单移动平均对近期的变化更加敏感,尤其是在牛熊市转换的时候,加权移动平均的滞后性小于简单移动平均。但是,由于仅采用线性权重衰减,加权移动平均仍然呈现出滞后性。

2. 指数加权函数

使用固定大小窗口及相等权数观测值的办法是,定义一个衰减因子(decay factor)常量,以便使近期的观测值拥有更大的权重。

  其中$\alpha$表示权重的衰减程度,取值在 0 和 1 之间。$\alpha$越大,过去的观测值衰减的越快。虽然指数移动平均是一个无穷级数,但在实际应用时,我们也经常看到T期指数移动平均的说法。这里的T是用来计算$\alpha$的参数,它不表示指数衰减在 T 期后结束。 $\alpha$和 T的关系为$\alpha=2/(T+1)$ 。

  下图比较了 $T=100$时简单移动平均、加权移动平均和指数移动平均的平滑效果。指数移动平均由于对近期的数据赋予了更高的权重,因此它比加权移动平均对近期的变化更加敏感,但这种效果在本例中并不显著,指数移动平均也存在一定的滞后。

  当$\alpha=1/T$时,得到的指数移动平均又称为修正移动平均(Modified Moving Average,MMA)或平滑移动平均(SMoothed Moving Average,SMMA),它们在应用中也十分常见。比如,在计算技术指标 ADX 的时候,就应用到了平滑移动平均。

  无论是加权还是指数移动平均,它们都是通过对近期的数值赋予更高的权重来提高低频趋势对近期变化的敏感程度。然而,它们的计算表达式(或算法结构)是固定的,在整个时间序列上的各个时点都使用同样的结构(即一成不变的权重分配方法)计算移动平均,而不考虑时间序列自身的特点。

举例:简单移动平均与指数加权移动平均

#简单移动平均与指数加权移动平均
fig,axes = plt.subplots(nrows=2,ncols=1,sharex=True,sharey=True,figsize=(12,7))
total_purchase_amt_ = df_purchase_redeem.total_purchase_amt['2013-1':'2014-1']

ma20 = total_purchase_amt_.rolling(20,min_periods=10).mean()
ewma20 = pd.ewma(total_purchase_amt_,span=20,)

total_purchase_amt_.plot(style=‘k-’,ax=axes[0])
ma20.plot(style=‘k–’,ax=axes[0])
total_purchase_amt_.plot(style=‘k–’,ax=axes[1])
ewma20.plot(style=‘k–’,ax=axes[1])
axes[0].set_title(‘MA’)
axes[1].set_title(‘指数加权 MA’)

3. 二元移动窗口函数

  有些统计运算(如相关系数和协方差)需要在两个时间序列上执行。例如,金融分析师常常对某只股票对某个参考指数(如标准普尔500指数)的相关系数感兴趣。我们可以通过计算百分数变化并使用rolling_corr的方式得到该结果。

pandas.rolling_corr(arg1, arg2=None, window=None, min_periods=None, freq=None, center=False, pairwise=None, how=None)

pct_change() #用于计算各种增长率,比如股市中的涨跌幅。计算变化率:(后一个值-前一个值)/前一个值

假设你想要一次性计算多只股票与标准普尔500指数的相关系数,需要传入一个TimeSeries和一个DataFrame各列的相关系数

4. 用户自定义的移动窗口函数

  通过rolling().apply()方法,可以在移动窗口上使用自己定义的函数。唯一需要满足的是,在数组的每一个片段上,函数必须产生单个值。

参考文献:

【1】pandas --移动窗口rolling的概念

【2】Pandas —— cum累积计算和rolling滚动计算

【3】python | pandas | 移动窗口函数rolling

【4】移动平均:你知道的与你不知道的

python移动窗口函数相关推荐

  1. Python Pandas窗口函数

    Python Pandas窗口函数 为了能更好地处理数值型数据,Pandas 提供了几种窗口函数,比如移动函数(rolling).扩展函数(expanding)和指数加权函数(ewm). 窗口函数应用 ...

  2. python统计窗口函数怎么处理_python时间序列:移动窗口函数前篇

    在移动窗口(可以带有指数衰减权数)上计算的各种统计函数也是一类常见于时间序列的数组变换.它们称为移动窗口函数,其中还包括那些窗口不定长的函数(如指数加权移动平均).跟其他统计函数一样,移动窗口函数也会 ...

  3. plot函数_时间序列:python移动窗口函数前言

    一起学习,一起成长! 在移动窗口(可以带有指数衰减权数)上计算的各种统计函数也是一类常见于时间序列的数组变换.它们称为移动窗口函数,其中还包括那些窗口不定长的函数(如指数加权移动平均).跟其他统计函数 ...

  4. python统计窗口函数怎么处理_python移动窗口函数

    rolling_count 计算各个窗口中非NA观测值的数量 函数 pandas.rolling_count(arg, window, freq=None, center=False, how=Non ...

  5. python移动窗口函数_设置窗口图标和移动窗口

    [TOC] # 设置窗口图标 ~~~ from PyQt5.QtWidgets import * from PyQt5.QtCore import * from PyQt5.QtGui import ...

  6. pythong小知识列表

    1.输出结果字段名数据对齐: pd.set_option('display.unicode.ambiguous_as_wide', True) pd.set_option('display.unico ...

  7. python center函数_python pandas移动窗口函数rolling的用法

    超级好用的移动窗口函数 最近经常使用移动窗口函数,觉得很方便,功能强大,代码简单,故将pandas中的移动窗口函数都做介绍.它都是以rolling打头的函数,后接具体的函数,来显示该移动窗口函数的功能 ...

  8. 【原创】MySQL 以及 Python 实现排名窗口函数

    大部分数据库都提供了窗口函数,比如RANK,ROW_NUMBER等等. MySQL 这方面没有直接提供,但是可以变相的实现,我以前写了row_number 的实现,今天有时间把 rank 的实现贴出来 ...

  9. python 窗口函数_太好用了!Python中8种流行的SQL窗口函数了解一下!

    有关如何在业务分析中利用Pandas来有效复制最常用的SQL窗口函数的教程. 任何致力于构建公司KPI或创建分析随着时间推移的业务绩效的数据分析人员都知道SQL窗口功能是一个强大的工具.使用它们的真正 ...

最新文章

  1. Numerical Geometry of Image
  2. myisam和innodb到底谁更快
  3. torchvision.transforms
  4. c语言写的程序如何移植,完全由C语言编写,高度可移植,超级牛逼的软件定时器!...
  5. php 修改 wordpress,wordpress如何修改php.ini
  6. Manjaro - KDE - i3wm - PloyBar 使用配置全指南
  7. java 高级工程师要求
  8. 用什么录屏软件能录制高清视频
  9. JavaScript设计模式之装饰者模式
  10. Introductions和Advisors标签
  11. Linux开发板实现 NTP时间获取
  12. Ubuntu16.04搭建mtk6737 安卓7.0 MTK 编译环境搭建
  13. 又要数数小绵羊(C++) kkmd66
  14. 什么是CDN?怎么搭建?搭建CDN需要什么软件!
  15. mysql去掉字段中的中文括号及括号中的内容
  16. TfLite: 把pb、h5文件转换为TfLite格式and quantilize
  17. CSS样式表引入的三种方式,及优先级顺序
  18. c语言线程怎么退出,如何用C语言实现多线程
  19. 论文的参考文献,添加交叉引用,实现编号自动更新,及编号1无法自动更新问题解决方法!!!
  20. 获取微信、新浪微博等apk签名的方法

热门文章

  1. HAProxy客户端IP地址的透传
  2. vivo系统如何没root激活Xposed框架的经验
  3. docker停止容器,删除镜像常用指令
  4. Amazon Corretto技术细节探秘
  5. 安全无忧,函数计算推出访问用户VPC功能,实现自定义的多类VPC网络资源互通...
  6. python--练习--将字符串转成列表
  7. [产品设计]为什么目前的运动手表的产品设计是错的?
  8. 关于 Ruby Ruby on Rails 的一些书及论坛网站
  9. 使用 Firefox攻击Web2.0应用(一)
  10. Moodle网络课程上如何添加视频文件