手把手教你用Python搭建自己的量化回测框架【均值回归策略】

引言

大部分量化策略都可以归类为均值回归与动量策略。事实上，只有当股票价格是均值回归或趋势的，交易策略才能盈利。否则，价格是随机游走的，交易将无利可图。均值回归是金融学的一个重要概念，指股票价格无论高于或低于价值中枢都会以很高的概率向价值中枢回归的趋势。中国古语“盛极而衰，否极泰来”，就暗含着均值回归的思想。如果说要为均值回归寻找一个比较合理的理论解释，不妨借鉴一下索罗斯的“反身性理论”。索罗斯认为。市场中存在正反馈和负反馈组成的反馈环（系统理论里的概念），其中正反馈是自我强化的过程（惯性或趋势），而负反馈是一个自我纠正的过程，倾向于把价格带回到均值附近，如股票经过大幅上涨后，总有一些交易者会因为股票价格过高而抛售，一旦没有足够的买盘跟进，少数人的抛售就会引起价格下跌，而价格的下跌会引起更多人的抛售，从而形成下跌的正反馈效应。本文以Zscore为指标构建均值回归的交易策略，并使用Pandas搭起基于研究的量化回测框架，以后将逐渐转向使用面向对象的编程方法来搭建基于事件驱动的量化回测系统（基于事件驱动的回测框架是主流）。

策略思想

均值回归策略的思想在引言中已有所介绍，此处不详细展开。其实，大家熟知的巴菲特价值投资策略和索罗斯的“反身”交易策略，从本质上来看都是均值回归理论的应用，所不同的是前者是基于价值低点向高点回归做多获得收益，后者则是通过泡沫破灭价值从高点向低点回归时做空进行投机获利。均值回归策略的思想很容易理解，实际操作中有很多构建的方法，比较常见的利用股价收益率偏离某段期间均值的若干个标准为阈值作为均值回归策略的买入卖出信号。下面将基于该原理，计算股价收益率的Zscore值，即以标准差为单位来衡量某一日收益率与平均收益率之间的离差情况。Talk is cheap, show your code!下面直接给出使用Python构建量化回测框架的过程和回测结果。

使用Python进行策略回测

数据准备与探索分析

全文使用tushare获取股票数据，在Jupyter notebook上运行代码。长期关注本公众号的朋友不难发现，第一段代码基本上在每篇文章中都会出现，引入可能用到的库以及从tushare上下载数据，这一段可以作为数据分析的模板，在以后的文章中可能会省略掉，直接上核心代码。

#先引入后面可能用到的包（package）
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
%matplotlib inline
#正常显示画图时出现的中文和负号
from pylab import mpl
mpl.rcParams['font.sans-serif']=['SimHei']
mpl.rcParams['axes.unicode_minus']=False

#使用tushare获取交易数据
#设置token
import tushare as ts
token='输入在tushare.pro上获取的token'
ts.set_token(token)
pro=ts.pro_api(token)
#pro=ts.pro_api(token)
index={'上证综指': '000001.SH','深证成指': '399001.SZ','沪深300': '000300.SH','创业板指': '399006.SZ','上证50': '000016.SH','中证500': '000905.SH','中小板指': '399005.SZ','上证180': '000010.SH'}
#获取当前交易的股票代码和名称
def get_code():df = pro.stock_basic(exchange='', list_status='L')codes=df.ts_code.valuesnames=df.name.valuesstock=dict(zip(names,codes))#合并指数和个股成一个字典stocks=dict(stock,**index)return stocks
#获取行情数据
def get_data(stock,start='20151009',end=''):#如果代码在字典index里，则取的是指数数据code=get_code()[stock]if code in index.values():df=ts.pro_bar(ts_code=code,asset='I',start_date=start, end_date=end)#否则取的是个股数据else:df=ts.pro_bar(ts_code=code, adj='qfq',start_date=start, end_date=end)#将交易日期设置为索引值df.index=pd.to_datetime(df.trade_date)df=df.sort_index()return df

从中国平安的股价走势来看，其单边趋势强于震荡趋势，因此均值回归策略可能不是中国平安在这段期间的最优策略，下面的回测结果将进一步展示。下面先来看看中国平安股票日收益率的波动及对标准差的偏离情况。日收益率图显示存在明显波动集聚的情况。日收益率标准化图是计算日收益率的滚动20日Zscore值，即当前收益率对其20日均值的标准差偏离度，此时波动集聚的情况不存在了。图中设定1.5倍标准差为阈值，偏离绿色线的点将作为买入卖出信号。

df=get_data('中国平安')
#df.tail()

returns=df.close.pct_change().dropna()
returns.plot(figsize=(14,6),label='日收益率')
plt.title('中国平安日收益图',fontsize=15)
my_ticks = pd.date_range('2015-10-1','2019-10-11',freq='q')
plt.xticks(my_ticks,fontsize=12)
plt.yticks(fontsize=12)
plt.xlabel('',fontsize=12)
# 将右边、上边的两条边颜色设置为空 其实就相当于抹掉这两条边
plt.axhline(returns.mean(), color='r',label='日收益均值')
plt.axhline(returns.mean()+1.5*returns.std(), color='g',label='正负1.5倍标准差')
plt.axhline(returns.mean()-1.5*returns.std(), color='g')
plt.legend()
ax = plt.gca()
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
plt.show()

ret_20=returns.rolling(20).mean()
std_20=returns.rolling(20).std()
score=((returns-ret_20)/std_20)
score.plot(figsize=(14,6),label='20日收益率标准化')
plt.title('中国平安日收益标准化图',fontsize=15)
my_ticks = pd.date_range('2015-10-1','2019-10-11',freq='q')
plt.xticks(my_ticks,fontsize=12)
plt.yticks(fontsize=12)
plt.xlabel('',fontsize=12)
plt.axhline(score.mean(), color='r',label='日收益均值')
plt.axhline(score.mean()+1.5*score.std(), color='g',label='正负1.5倍标准差')
plt.axhline(score.mean()-1.5*score.std(), color='g')
plt.legend()
ax = plt.gca()
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
plt.show()

策略设计与回测

加载数据

这里加载了open、close、low、high和vol数据主要是为了后面的可视化分析。数据获取中以沪深300指数作为参考基准，读者可以根据需要进行修改。

#获取数据
def data_feed(stock,start='20151009',end=''):#获取个股数据df=get_data(stock,start,end)[['open','close','low','high','vol']]#指数数据,作为参照指标df['hs300']=get_data('沪深300',start,end).close.pct_change()#计算收益率df['rets']=df.close.pct_change().dropna()return df.dropna()

交易策略

计算日收益率的滚动20日Zscore值，当Zscore小于-1.5并且第二天开盘没有涨停时，在第二天开盘买入；当Zscore大于1.5且第二天开盘没有跌停时，在第二天开盘卖出，每次都是全仓买卖。

def MR_Strategy(df,lookback=20,buy_threshold=-1.5,sell_threshold=1.5,cost=0.0):'''输入参数：df为数据表: 包含open,close,low,high,vol，标的收益率rets，指数收益率数据hs300lookback为均值回归策略参数，设置统计区间长度，默认20天buy_threshold:买入参数，均值向下偏离标准差的倍数，默认-1.5sell_threshold:卖出参数，均值向上偏离标准差的倍数，默认1.5cost为手续费+滑点价差，可以根据需要进行设置，默认为0.0'''#计算均值回归策略的Zscore值ret_lb=df.rets.rolling(lookback).mean()std_lb=df.rets.rolling(lookback).std()df['score']=(df.rets-ret_lb)/std_lbdf.dropna(inplace=True)#设计买卖信号，为尽量贴近实际，加入涨跌停不能买卖的限制#当Zscore值小于-1.5且第二天开盘没有涨停发出买入信号设置为1df.loc[(df.score<buy_threshold) &(df['open'] < df['close'].shift(1) * 1.097), 'signal'] = 1#当Zscore值大于1.5且第二天开盘没有跌停发出卖入信号设置为0df.loc[(df.score>sell_threshold) &(df['open'] > df['close'].shift(1) * 0.903), 'signal'] = 0df['position']=df['signal'].shift(1)df['position'].fillna(method='ffill',inplace=True)df['position'].fillna(0,inplace=True)#根据交易信号和仓位计算策略的每日收益率df.loc[df.index[0], 'capital_ret'] = 0#今天开盘新买入的position在今天的涨幅(扣除手续费)df.loc[df['position'] > df['position'].shift(1), 'capital_ret'] = \(df['close'] / df['open']-1) * (1- cost) #卖出同理df.loc[df['position'] < df['position'].shift(1), 'capital_ret'] = \(df['open'] / df['close'].shift(1)-1) * (1-cost) # 当仓位不变时,当天的capital是当天的change * positiondf.loc[df['position'] == df['position'].shift(1), 'capital_ret'] = \df['rets'] * df['position']#计算标的、策略、指数的累计收益率df['capital_line']=(df.capital_ret+1.0).cumprod()df['rets_line']=(df.rets+1.0).cumprod()df['hs300_line']=(df.hs300+1.0).cumprod()return df

计算策略的评价指标

完整代码只在知识星球上分享，可扫描最下方二维码加入。

# 根据每次买入的结果,计算相关指标
def trade_indicators(df):由于篇幅所限，此处代码省略#df为策略返回的数据框，包含策略的收益率# 计算资金曲线# 记录买入或者加仓时的日期和初始资产# 输出账户交易各项指标

def performance(df):由于篇幅所限，此处代码省略#df为策略返回的数据框，包含策略的收益率# 计算每一年(月,周)股票,资金曲线的收益# 计算策略的年（月，周）胜率#计算总收益率、年化收益率和风险指标

#对策略和标的股票累计收益率进行可视化
def plot_performance(df,stock):由于篇幅所限，此处代码省略#df为策略返回的数据框，包含策略的收益率#stock为回测的股票简称

def plot_strategy_signal(df,trade,stock):由于篇幅所限，此处代码省略#对K线图和买卖信号进行可视化#使用pyecharts 0.5.11版本

#将上述函数整合成一个执行函数
def main(stock,start,end):d0=data_feed(stock,start,end)d1=MR_Strategy(d0)print(f'回测标的：{stock}')print(f'回测期间：{start}—{end}')trade=trade_indicators(d1)performance(d1)plot_performance(d1,stock)return d1,trade03回测结果分析下面分别选择中国平安、奥马电器和九州通股票进行均值回归策略回测，时间区间为2015年10月9日至2019年10月11日，跨度四年左右。结果显示出均值回归策略对不同标的表现差异较大。值得注意的是奥马电器由于2018年出现19亿巨亏的黑天鹅事件，股价从16.53跌至3.19，最大回撤高达86%，回测期间总收益-29%;策略回撤也达到56%，但是总收益为正2.4%。总体而言，均值回归策略应用了股市投资中经典的高抛低吸思想，该类型策略一般在震荡市中表现优异（九州通）；但是在单边趋势行情中一般表现糟糕（中国平安），往往会大幅跑输市场（奥马电器）。
#对中国平安股票进行策略回测
stock='中国平安'
d1,trade=main(stock,'20151009','20191011')
plot_strategy_signal(d1,trade,stock)

输出回测结果
回测标的：中国平安

回测期间：20151009—20191011

==============每笔交易收益率及同期股票涨跌幅=============== start_date end_date trade_return stock_return 16 2015-11-30 2015-12-03 0.054617 0.062943 21 2015-12-07 2015-12-15 0.014286 0.008871 37 2015-12-29 2016-02-01 -0.155182 -0.172830 74 2016-02-26 2016-03-03 0.031370 0.049032 123 2016-05-09 2016-05-13 0.005099 0.010190 156 2016-06-27 2016-07-13 0.046194 0.040052 180 2016-07-29 2016-08-10 0.001848 0.002772 193 2016-08-17 2016-09-20 0.033013 0.033413 220 2016-09-27 2016-10-31 0.004965 0.006689 242 2016-11-03 2016-11-22 0.035270 0.043629 262 2016-12-01 2017-01-17 -0.007703 -0.009634 303 2017-02-06 2017-02-21 0.030497 0.032285 346 2017-04-10 2017-04-26 0.000273 0.024861 365 2017-05-08 2017-05-11 0.068169 0.067365 391 2017-06-15 2017-07-06 0.068447 0.088540 418 2017-07-24 2017-08-02 0.052418 0.040032 502 2017-11-24 2017-12-11 -0.039784 -0.014396 526 2017-12-28 2018-01-16 0.104979 0.106040 548 2018-01-30 2018-02-14 -0.074074 -0.060932 582 2018-03-26 2018-04-11 -0.013005 -0.037411 604 2018-04-27 2018-05-09 -0.007082 -0.002692 626 2018-05-31 2018-06-01 0.013092 0.016323 639 2018-06-20 2018-07-02 -0.058481 -0.110647 648 2018-07-03 2018-07-10 0.061150 0.053605 670 2018-08-02 2018-08-08 0.002356 -0.022110 680 2018-08-16 2018-09-05 0.142426 0.101175 695 2018-09-06 2018-09-25 0.077294 0.080475 712 2018-10-09 2018-10-22 0.021354 0.048627 727 2018-10-30 2018-11-05 0.108334 0.073872 799 2019-02-18 2019-02-19 0.026291 0.038420 806 2019-02-27 2019-04-01 0.109530 0.122698 851 2019-05-07 2019-05-13 -0.030937 -0.031403 912 2019-08-01 2019-08-13 -0.017714 -0.034963 930 2019-08-27 2019-09-16 0.057058 0.052755

====================账户交易的各项指标===================== 交易次数为：34 最长持有天数为：47 每次平均涨幅为：0.022540 单次最大盈利为：0.142426 单次最大亏损为：-0.155182 年均买卖次数为：8.953824 最大连续盈利次数为：8 最大连续亏损次数为：3 策略年胜率为：80.0% 策略月胜率为：77.5% 策略周胜率为：59.26% 总收益率：策略102.33%，股票177.87%, 指数5.55% 年化收益率：策略20.19%, 股票30.56%，指数1.42% 最大回撤：策略19.17%, 股票28.54%，指数32.46% 策略Alpha： 0.2, Beta：0.43，夏普比率：1.92

stock='奥马电器'
d1,trade=main(stock,'20151009','20191011')
plot_strategy_signal(d1,trade,stock)

回测标的：奥马电器
回测期间：20151009—20191011==============每笔交易收益率及同期股票涨跌幅===============
略
====================账户交易的各项指标=====================
交易次数为：24   最长持有天数为：65
每次平均涨幅为：0.014195
单次最大盈利为：0.491054  单次最大亏损为：-0.452403
年均买卖次数为：6.522710
最大连续盈利次数为：4  最大连续亏损次数为：2
策略年胜率为：40.0%
策略月胜率为：65.0%
策略周胜率为：51.89%
总收益率：  策略8.18%，股票-68.03%, 指数22.43%
年化收益率：策略2.46%, 股票-29.7%，指数6.45%
最大回撤：  策略56.72%, 股票86.1%，指数26.39%
策略Alpha： -0.01, Beta：0.59，夏普比率：0.37

stock='九州通'
d1,trade=main(stock,'20151009','20191011')
plot_strategy_signal(d1,trade,stock)

回测标的：九州通
回测期间：20151009—20191011==============每笔交易收益率及同期股票涨跌幅===============
略
====================账户交易的各项指标=====================
交易次数为：33   最长持有天数为：50
每次平均涨幅为：0.006272
单次最大盈利为：0.103585  单次最大亏损为：-0.142085
年均买卖次数为：8.665468
最大连续盈利次数为：6  最大连续亏损次数为：3
策略年胜率为：60.0%
策略月胜率为：58.54%
策略周胜率为：51.69%
总收益率：  策略16.93%，股票-27.96%, 指数1.57%
年化收益率：策略4.21%, 股票-8.28%，指数0.41%
最大回撤：  策略25.56%, 股票49.51%，指数32.46%
策略Alpha： 0.04, Beta：0.39，夏普比率：0.31

结语

本文主要介绍了均值回测策略的基本思想，以及使用Pandas构建基于研究的量化回测框架对策略进行回测，回测结果比较直观（感兴趣的朋友可以把交易费用和滑点价差考虑进去，文中设置为0了）。当然，上述回测框架还存在一些细节问题需要完善，而且基于研究的回测框架和基于pandas的向量式编程存在一定的局限性，尽管容易理解，但不适合用于处理更复杂的交易情形。以后有机会将为大家介绍使用面向对象编程（Class类）的方法构建基于事件驱动的量化回测框架，可以借鉴backtrader、zipline等开源框架。尽管均值回归非常普遍，但要准确回测一个盈利的均值回归策略却存在很多陷阱。比如，许多历史金融数据库中都包含报价错误，而这些错误可能会抬高均值回归策略的业绩。另外，存活偏差也会影响均值回归策略的回测，即那些股价一直下跌最后退市而没有出现均值回归的股票早已从数据库中剔除。对于均值回归策略而言，典型的结果就是套利机会的逐步消失，从而使得收益率逐渐降低至零。当套利机会消失殆尽时，均值回归策略就变得没那么有效，因为越来越多的交易信号来自于股票估值的基本面变化，而这并不会均值回归。

关于Python金融量化

专注于分享Python在金融量化领域的应用。加入知识星球，可以免费获取量化投资视频资料、量化金融相关PDF资料、公众号文章Python完整源码、量化投资前沿分析框架，与博主直接交流、结识圈内朋友等。

手把手教你用Python搭建自己的量化回测框架【均值回归策略】相关推荐

金融平台（掘金量化）量化PYTHON（二）-量化回测框架介绍
策略创建运行流程 1.创建运行策略 1.1创建策略打开"掘金量化3.0"客户端,进入"我的策略"-"新建策略",如下所示: 平台本身提供了 ...
【python量化】国内外基于python开发的量化回测框架
文章目录写在前面 Zipline PyAlgoTrade BackTrader Catalyst Vn.py 总结写在前面在进行量化策略开发时,必不可少的就是策略回测,虽然有很多量化回测平台如三 ...
python量化策略源码_Python量化交易进阶讲堂-创建自定义量化回测框架
欢迎大家订阅<Python实战-构建基于股票的量化交易系统>小册子,小册子会陆续推出与小册内容相关的专栏文章,对涉及到的知识点进行更全面的扩展介绍,并且会有选择地收录至小册中,更便于广大读 ...
用Python徒手撸一个股票回测框架
通过纯Python完成股票回测框架的搭建. 什么是回测框架? 无论是传统股票交易还是量化交易,无法避免的一个问题是我们需要检验自己的交易策略是否可行,而最简单的方式就是利用历史数据检验交易策略,而回测 ...
python量化回测框架_股票量化交易回测框架pyalgotrade源码阅读(一)
PyAlgoTrade是什么呢? 一个股票量化交易的策略回测框架. 而作者的说明如下. To make it easy to backtest stock trading strategies. 简单 ...
手把手教你用Python搭建IP代理池，轻松破解请求频率限制反爬虫~
我们所写的爬虫,它对服务器发出的网络请求频率要比正常用户的高的多,从而开发者可以将请求频率过高的用户视为爬虫程序,从而来限制爬虫程序. 今天志斌就来给大家分享一下,如何用Python搭建一个IP代理池 ...
手把手教你用Python搭建IP代理池
今天给大家分享一下,如何用Python搭建一个IP代理池,来破解服务器通过对用户请求频率进行限制的反爬虫. 01 原理因为客户端的IP地址是唯一的,所以开发者便将IP地址作为客户端的身份标识. 服务 ...
python 金融分析代码_手把手教你以python为工具进行量化金融分析
量化交易是指借助现代统计学和数学的方法,利用计算机技术进行投资交易的方式. 对于从未接触过量化的人来说,想要了解量化到底是做什么的,关键掌握四部份的内容:Python基础知识.金融知识.技术指标.量化 ...
手把手教你用Python搭建一个AI智能问答系统
导读:智能问答系统是自然语言处理的一个重要分支.今天我们将利用分词处理以及搜索引擎搭建一个智能问答系统. 本文经授权转自公众号CSDN(ID:CSDNnews) 作者:李秋键具体的效果如下所示: 下 ...

手把手教你用Python搭建自己的量化回测框架【均值回归策略】

手把手教你用Python搭建自己的量化回测框架【均值回归策略】相关推荐

最新文章

热门文章