沪深两市挂牌公司已有3157家,现在还有若干企业在IPO排队中。

以后,股票只会越来越多……

再加上去年量化业绩干得还不错,现在市场延续震荡行情,都说今年也挺适合:

他们说的保守估计的收益率听起来一点都没有“保守”的成色。

听着让人心痒痒,但是好怕被忽悠了。

想来想去不如一探究竟。

注意,前方高能预警!高能预警!预警!警!

又在瞎BB,我就爱高能,咋的

先从几个常见的情形说起:

(1)某公司年会抽奖,大屏幕显示幸运号码:尾号是6的是三等奖,后两位是66的是二等奖,后三位是666的是一等奖...不妨把这叫“量化抽奖”;

(2)某城市交通拥堵,雾霾严重,周末两天分别单、双号限行,不妨叫做“量化限行”;

(3)某班级有49人,按从矮到高排成一队并从1-7报数,数字一样的站成1队,最终形成方阵,不妨叫做“量化排队”。

……

那按一定的筛选标准从一大堆股票中间挑选出符合条件的股票的方法,都可称作“量化选股”咯? 我就喜欢股票代码中有7、股票名称总共3个字且笔画数大于24的.....

可是量化选股的目的不是为了喜欢,上面这种做法显然只是在玩游戏,跟收益挂不上。我们是为了找到未来可能表现好的股票,获取超额收益。

选出那些害羞的,他们身怀绝技

2017上海半程马拉松赛3月16日开始预报名,如果我们想知道哪些选手最终可能会取得比较好的名次,理论上我们可以在开跑前对他们做一个身体测试,比如测一下他们的肺活量、最大摄氧量等指标。并对测试的结果进行排名,排名靠前的选手获得好名次的可能性就比较大。

因子选股模型的原理与此类似,可以利用某些指标也就是因子选择未来可能表现较好的股票。

如此一来,就找到了问题的关键点,选择什么样的因子才能选出这样的股票呢?

我们知道影响股价的因子非常多,宏观经济状况、行业前景、公司经营状况、甚至天气、季节都不是没有可能。而判断这些因子是什么状况,又有一系列可以量化的因子指标,比如:GDP增速、CPI、PPI、行业景气指数、行业集中度、净利润率、主营业务收入增长率、降雨量、日照指数、温度变化……

失业不仅影响心情,也影响了股价

看起来有种没完没了的节奏,这么多,指望着10个手指头一一算过来,黄花菜都凉了。

可别忘了我们有计算机。

计算机运算快是众所周知的,

可是得知计算机每秒运算几十亿次到上千万亿次,

仍然感觉很震惊

理论上讲,什么因子我们都可以拿来验证一下是否有效。

很多公司的计算机配置很是超前,算这些都是小意思,只有你想不出,没有算不出。

不过理论之外,很多因子还是没法计算,再先进的配置也是枉然,因为没有数据或者数据拿不到。

而且,如果一个包罗万象的因子库,很有可能导致过度拟合的情况,导致最终选不出好的股票了。

结合我们自己的经验和市场规律以及数据的可得性,我们会得到一个候选因子库。

选取候选因子的标准应该遵循哪些规则呢?

这主要是由投资者经验和市场规律来决定的,较多的候选因子将为构建投资组合的全面性做出更强的保证,更有效的候选因子才能保证投资组合的收益率。

如果没有经验,可以先看看别人都选了啥:

估值因子:

市盈率、市净率、账面市值比、股息率、现金收益率

成长因子:

净资产收益率及变动、总资产收益率及变动、主营收入增长率、毛利率及变动、净利率及变动

价量因子:

1、3、6个月收益率、1、3、6个月换手率及变动

预期因子:

机构覆盖数量、评级调整……

根据国泰君安、安信证券相关研究报告整理

有的机构因子库中有数百个候选因子。

这么多因子,只是有经验的人列出来的清单,在一定的时间段内对选股来说未必都有效。

检验候选因子的选股有效性一般采用的检验方法是排序的方法。

简单来说,每一个因子都是一个指标,把股票按每个指标值从小到大的顺序都排一下,然后分别选取每个指标最高、最低极端的2组计算他们的区间收益率(一般为月度,分组目前一般采用5档)及收益率与因子的相关性。

比如:我们认为身高高的力量可能会大,

于是身高最高的组和身高最矮的组选出来

看一下身高高的力量是否真大,身高最矮的力量是否就真的小

为什么不必计算全部?因为如果最大最小的两组收益率都对因子有相关性,那么中间的组也就无需计算了。

所谓相关性是指:如果因子指标高,收益率也高,那么就是正相关;反之就是负相关。因为选取了两组极端的股票组合,假如跟因子是正相关,那么因子指标高的那组就是“高收益组”,反之亦然。

然后统计“高收益率组”各月收益率在各种市场状况(牛市、熊市)下跑赢业绩比较基准的概率,这是因为我们选股的目的是跑赢市场,获得正的阿尔法,如果“高收益率组”收益率超过基准业绩的概率小于50%,那么这个因子就是无效的,应予以剔除。

当然也可以要求更高更苛刻的概率标准,来确保找到更有效的因子。

反复这样操作,我们就找到了有效的因子。

但有可能这些因子之间有很强的相关性,我们可以据此剔除掉一些。什么叫很强的相关性?这个可以自己设置一个阈值,既可以是超过0.5的也可以是超过0.6,根据自己的经验来调整。

那么,接下来怎么通过有效因子选股呢?

还记得我们之前说过的排序了么?排序可以转化成一个分数。既然因子都已经确定了,那么相对于这些因子来说,每个股票都在某一个因子上有了一个分数。遇到最终是负相关的因子,股票的分数需要逆向转换一下。

最后将这些分数按因子加权加总(也可以等权),找出若干分数高的股票,选股就算完成了。若干设置为多少比较合适呢?这个我们可以放在以后讨论。

在实际操作过程中,各个环节的设置可能会有些出入,但是基本逻辑大致相当。

当然在最后确认是如何加权时,直接采用打分的方法设置的权重会有更多的主观色彩,还有一种方法是通过回归得到系数避免这个问题。在此我们不再展开。

模型建立不是一劳永逸的,曾经有效的模型也可能由于市场突然变化而失效。适时的调整是必须的。

我们再来回顾一下整个流程吧:

先是弄一堆候选因子

然后找到候选因子的具体数据

再把有效因子筛选出来

通过打分筛选出股票

适时调整

大功告成!

这就是经典的因子选股的线性模型,然而现在更流行的是非线性模型,就是我们多次说到的机器学习的方法来确定和调整因子,比如人工神经网络算法,实际过程比这个要复杂的多,离开大数据和计算机寸步难行。

推荐阅读:

1.市面上经典的量化交易策略都在这里了!(源码)

2.海龟交易法则策略,多读几遍少走10年路

3.配对交易—这个股票策略曾年赚5000万美元

4.揭开日内回转交易策略做“T+0”的面纱

5.被动与主动的完美结合:指数增强策略的魅力

6.网格交易法,一个不容易亏钱的投资策略(附源码)

量化选股之经典的因子选股相关推荐

  1. 秒懂量化选股之最经典的因子选股

    沪深两市挂牌公司已有3157家,现在还有若干企业在IPO排队中. 以后,股票只会越来越多-- 再加上去年量化业绩干得还不错,现在市场延续震荡行情,都说今年也挺适合: 他们说的保守估计的收益率听起来一点 ...

  2. 用聚宽量化炒股-财务因子选股-1成长类因子选股-1

    量化选股是利用数量化的方法选择股票组合,期望该股票组合能够获得超越基准收益率的投资行为. 量化选股可以分为两类:基本面选股和技术面选股. 在实际的股票投资中,往往利用基本面选出要操作的股票,然后根据技 ...

  3. 数据分析--单因子选股策略、多因子选股策略(选股)

    数据分析--单因子选股策略.多因子选股策略(选股) 一.单因子选股策略--小市值策略 二.多因子选股策略--市值+ROE(净资产收益率)选股策略 一.单因子选股策略--小市值策略 因子选股策略 因子: ...

  4. 基本面量化:一种多因子选股策略

    斜拉大桥的钢缆由许许多多钢丝组成,这样才更有弹性,可支撑起整座大桥.如果投资模型有多组上百个阿尔法因子科学地组合在一起,因子之间风险的可互相抵消,就有望在不同市况下都能获得相对稳定的超额收益.基本面多 ...

  5. 绘制levy曲线python_量化小白暑期研究笔记(5)——因子选股-高质量动量策略

    一.动量策略的一点历史 1.1 三大互补选股维度 1.Momentum:当价格沿着过去的轨迹继续运动时,我们能够获得收益: 2.Value:当价格恢复到之前的某种均衡状态时,我们能够获得收益: 3.C ...

  6. python数据分析及可视化(十七)聚宽(双均线分析、因子选股策略、多因子选股策略、均值回归理论、布林带策略、PEG策略、权重收益策略)

    聚宽 聚宽是一个做金融量化的网站,https://www.joinquant.com,登录注册,如果你写的文章.策略被别人采纳,增加积分,积分用于免费的回测时长.在我的策略,进入策略列表,里面有做好的 ...

  7. 多因子选股模型python_多因子选股模型构建初尝试(更新中)

    数据获取--Tushare包 由于Tushare 中的数据比较全,数据调取的速度也比较快,最主要的是免费,所以选择使用它. Tushare 安装 直接用pip安装实在是太!慢!了! 但是由于最近清华源 ...

  8. 用python做股票因子分析_Python量化交易教程(3)因子选股与回测

    量化QQ群:371474481 因子选股模型是应用最为广泛的一种选股模型,基本原理是采用某个或某些因子作为选股的标准,满足这些因子的股票则被买入,不满足的则卖出. 因子选股模型为什么适用?举一个简单的 ...

  9. 量化投资之多因子选股(一):数据准备与单因子检验

    文章目录 前言 系列文章 矢量化选股回测概述 要点1:数据格式 要点2:股票池 要点3:剔除ST股.停盘股.涨跌停 要点4: 仓位构建 要点5:回测 数据准备 单因子检测 样例 前言 本菜狗现在是哈工 ...

最新文章

  1. VEND MASTER DATA
  2. Panabit 安装指南
  3. Java集合框架图(学习)
  4. 什么是 Native、Web App、Hybrid、React Native和Weex?
  5. MySQL-第十三篇使用ResultSetMetaData分析结果集
  6. 车辆路径问题(VRP)初探
  7. 二阶带通有源滤波器设计与仿真测试
  8. 《心流》| 成年人的友谊,甜蜜与苦涩交杂
  9. mac录屏如何把声音录进去?
  10. Ajax传JSON对象报错:JSON parse error: Unrecognized token ‘ids‘: was expecting (‘true‘, ‘false‘ or ‘null‘);
  11. 黑色家具家居茶几沙发网站源码 织梦dedecms模板 [带手机版数据同步]
  12. module_init源码分析
  13. 如何真正从零开始学习Python
  14. ​五分钟扫盲:进程与线程基础必知
  15. 解决锐捷客户端出现密码不匹配,请输入正确密码问题
  16. 分享5个常用的CMD命令。
  17. oracle教程目录(我要自学网)
  18. 盘点男士们也喜爱的八大女性APP
  19. LabVIEW(十五):右键菜单添加创建VI模版
  20. GIMP - 免费开源的图像处理软件,功能强大,被称为 Photoshop 的优秀替代品

热门文章

  1. iOS版本、iPhone版本、Xcode版本比对
  2. rsyslog-trouble: imjournal: 26794 messages lost due to rate-limiting
  3. 消费者理论:效用函数
  4. 呼叫中心电话系统,你了解多少?
  5. 高兴,今天总算鸟枪换炮了~
  6. Redis 异地双活实战
  7. 如何将一段视频做成动图?分享一款视频转gif工具
  8. 有关获取并保存微信头像到本地服务器
  9. c语言扇形打印图片,圆形CD绘制 (扇形)
  10. “熊孩子”乱敲键盘就攻破了Linux桌面,大神:17年前我就警告过你们