量化选股模型—多因子模型
多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。
基本概念
举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。
各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。
一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。
打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。
多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步 骤。
候选因子的选取
候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。
例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。
从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。
同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。
选股因子有效性的检验
一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验,
具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小, 按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。
上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。
有效但冗余因子的剔除
不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除, 而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。
冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为:
(1)先对不同因子下的n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高
(2)按月计算个股的不同因子得分间的相关性矩阵;
(3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值
(4)设定一个得分相关性阀值 MinScoreCorr,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。
综合评分模型的建立和选股
综合评分模型选取去除冗余后的有效因子,在模型运行期的某个时间开始,例如每个月初,对市场中正常交易的个股计算每个因子的最新得分并按照一定的权重求得所有因子的平均分。最后,根据模型所得出的综合平均分对股票进行排序,然后根据需要选择排名靠前的股票。例如,选取得分最高的前20%股票,或者选取得分最高的 50 到 100 只股票等等。
举个例子:可以构建一个多因子模型为(PE,PB,ROE),在月初的时候,对这个几个因子进行打分,然后得分最高的50个股票作为投资组合,在下个月按照同样的方法进行轮换替换。持续一段时间后,考场该投资组合的收益率是否跑赢比较基准,这就是综合评分模型的建立和后验过程。
当然这个例子是一个最简单的例子,实战中的模型可能会比较复杂,比如沃尔评分法就是一个复杂的多因子模型,它是对股票进行分行业比较,算个每个行业的得分高的组合,然后再组合成投资篮子。
模型的评价及持续改进
一方面,由于量选股的方法是建立在市场无效或弱有效的前提之下,随着使用多因子选股模型的投资者数量的不断增加,有的因子会逐渐失效,而另一些新的因素可能被验证有效而加入到模型当中;另一方面,一些因子可能在过去的市场环境下比较有效,而随着市场风格的改变,这些因子可能短期内失效,而另外一些以前无效的因子会在当前市场环境下表现较好。
另外,计算综合评分的过程中,各因子得分的权重设计、交易成本考虑和风险控制等都存在进一步改进的空间。因此在综合评分选股模型的使用过程中会对选用的因子、模型本身做持续的再评价和不断的改进以适应变化的市场环境。
多因子的模型最重要是两个方面:一个是有效因子,另外一个是因子的参数。例如到底是PE有效还是ROE有效;到底是采用1个月做调仓周期还是3个月做调仓周期。这些因子和参数的获取只能通过历史数据回测来获得。但是在回测过程中,要注意,不能过度优化,否则结果可能反而会不好。
影响股价走势的主要因子包括市场整体走势(市场因子,系统性风险)
估值因子(市盈率、市净率、市销率、市现率、企业价值倍数、PEG等)
成长因子(营业收入增长率、营业利润增长率、净利润增长率、每股收益增长率、净资产增长率、股东权益增长率、经营活动产生的现金流量金额增长率等)
盈利能力因子(销售净利率、毛利率、净资产收益率、资产收益率、营业费用比例、财务费用比例、息税前利润与营业总收入比等)
杠杆因子(负债权益比、资产负债率等)
动量反转因子(前期涨跌幅等)
交易因子(前期换手率、量比等)
规模因子(流通市值、总市值、自由流通市值、流通股本、总股本等)
股价因子(股票价格)
红利因子(股息率、股息支付率)
股价波动因子(前期股价振幅、日收益率标准差等)
市场预期因子(预测净利润增长率、预测主营业务增长率、盈利预测调整等)。
拓展阅读:
1.一个量化策略师的自白(好文强烈推荐)
2.市面上经典的量化交易策略都在这里了!(源码)
3.期货/股票数据大全查询(历史/实时/Tick/财务等)
4.干货| 量化金融经典理论、重要模型、发展简史大全
5.从量化到高频交易,不可不读的五本书
6.高频交易四大派系大揭秘
量化选股模型—多因子模型相关推荐
- 什么是多因子量化选股模型?
量化投资中经常听到的"多因子模型"是个什么鬼?因子是影响因素的简称,或简单理解成指标.我们都知道股票收益受到多重因素的影响,比如宏观.行业.流动性.公司基本面.交易情绪等等.所谓& ...
- 多因子选股模型python_什么是多因子量化选股模型?
引言 量化投资中经常听到的"多因子模型"是个什么鬼?因子是影响因素的简称,或简单理解成指标.我们都知道股票收益受到多重因素的影响,比如宏观.行业.流动性.公司基本面.交易情绪等等. ...
- 基于支持向量机的量化选股模型
要求开发一个基于支持向量机技术的多因子量化投资模型,以近五年沪深300成分股的交易与财务数据为样本,结合大数据相关技术进行数据清洗,整理,存储,并构建投资策略与回测框架,输出量化投资模型的结果,为投资 ...
- 手工选出的股票池和量化选股模型选出的股票池有哪些区别?
虽然逻辑上看似比较简单,但是往往手工选出的股票池并不是最优解.因为一个成熟的模型往往需要进行多次的尝试和回溯测试,而客户自身的选股逻辑经常会受到主观意识的干扰,导致股票组合的实际表现不佳. 量化选股模 ...
- 两种方法筛选出多因子量化选股模型
多因子选股模型在模型搭建中,往往会涉及到非常多的股价影响因子,并可能导出数量极多的备选模型.因此,对于多因子选股模型的评价和筛选,就显得尤为关键. 对于专业的量化投资人而言,就需要进一步了解多因子选股 ...
- python多因子量化选股模型_【邢不行|量化小讲堂系列12-Python量化入门】法码三因子选股模型,有多少人可以跑赢...
引言: 邢不行的系列帖子"量化小讲堂",通过实际案例教初学者使用python进行量化投资,了解行业研究方向,希望能对大家有帮助. 个人微信:xingbuxing0807,有问题欢迎 ...
- python多因子量化选股模型_多因子量化选股模型的筛选和评价:打分法与回归法...
多因子选股模型在模型搭建中,往往会涉及到非常多的股价影响因子,并可能导出数量极多的备选模型.因此,对于多因子选股模型的评价和筛选,就显得尤为关键.对于专业的量化投资人而言,就需要进一步了解多因子选股模 ...
- 2种方法筛选出多因子量化选股模型
多因子选股模型在模型搭建中,往往会涉及到非常多的股价影响因子,并可能导出数量极多的备选模型.因此,对于多因子选股模型的评价和筛选,就显得尤为关键. 对于专业的量化投资人而言,就需要进一步了解多因子选股 ...
- python多因子量化选股模型_GitHub - zhangjinzhi/Wind_Python: 量化开发 多因子选股模型...
多因子选股模型 multifactorial_model文件夹中是目前最完整的. 版本1和2是初级的实现.对数据库进行了多次操作,更多的是考虑功能,性能问题暂时作为次要的. 版本3是改进版本,对原始数 ...
- python多因子量化选股模型_量化新兵第十步:多因子选股模型
前 言 APT套利定价理论是在资本资产定价理论的基础上进行延申,假定因素模型能描述证券收益,当市场不存在无风险套利时,可以构建多因子线性模型给股票定价,若结果与实际股价发生偏差,我们可以对低估值的股 ...
最新文章
- 分区表与分区索引(一):范围分区表的操作
- 使用Gson 解析json
- 服务器客户端回射程序-自己设计包的结构
- webpack初学笔记 之 小案例篇demo1
- [小程序]微信小程序登陆并获取用户信息
- 科研入门之在web of science
- 限流算法(记录cyc大佬的专栏)
- 函数read、write、lseek
- 贪婪算法在求解最小生成树中的应用(JAVA)--Prim算法
- Linux服务器运行环境搭建(四)——Tomcat安装
- gnu ld链接出现“ no .eh_frame_hdr table will be created.”
- linux应用程序调用aplay,linux - 在播放整首歌曲之前,aplay退出 - 堆栈内存溢出
- requests模块练习1
- 【粉丝福利】第二波 | 当当购书狂欢,满 400 减 230!下单充电速来!
- 中国航空公司特点机型
- 大数据是什么?1分钟了解大数据的概念!
- 电脑上最好的5个epub阅读器
- PDA 手持式智能终端和 RFID 技术
- h标签本身自带间距 去除方法
- 剪辑软件生产力工具pr,ae,达芬奇对比