本文是多因子模型水平测试题最后一部分,说的不对的地方还请多指正。作者:call (知乎@李白 )

组合构建

1. 利用多因子模型进行选股,求解每期股票权重的问题本质上是一个带约束的最优化问题,请阐述优化目标和约束条件各是什么?

2. 组合优化有哪些常见方法?各要注意什么问题?

二次规划

3. 股票组合中个股权重上限的设计有什么技巧?大约应设置在什么范围?【个股权重不能太大,否则只会集中买入每个行业预期收益最高的股票;也不能太小,否则可能出现某个行业内所有股票都持仓至上限也无法达到行业中性。参考值:2%~3%,应根据实际情况调整取值】

答案如题

4. 是否要根据个股的交易量来限制个股权重的上限?

需要,在优化条件中加入这一限制

5. 如何预估市场冲击?

6. 是否可以(大概)控制每个版块的持仓个股数?如何做?【参考方法:股权重上限为它所处行业在沪深300(或其他基准)中占比除以希望持仓的个股数】

题中参考方法即可,也需要考虑板块个股数目很少的情况

7. 建立选股模型时,如何控制行业中性、市值中性(或其他条件)?

这个和策略的侧重点相关,可以选择把行业因子和市值因子中性掉,也可以选择暴露一部分

8. 建立选股模型时,如何处理交易成本、股票停牌等问题?如何计买入、卖出价?

停牌时可以以行业涨跌幅计;或者以历史回归beta计算停牌涨跌

9. 纯多头约束对组合构建的影响不止是少了一半的获利机会,这句话怎样理解

多因子模型本质上是统计套利模型,纯多头约束除了导致少了空头收益之外,也会导致你多了一份风险

10. 纯多头股票组合策略应选择怎样的指数作为基准?沪深300、中证500、中证800?各有什么利弊?

不同指数对应于不同的一篮子股票,有着不同的大小盘、行业风格;沪深300偏向大盘;选择基准需要考虑到你的策略因子的实际逻辑;实际上,这个可以通过回测结果看出来

11. 应该每日调整头寸,还是更低的频率,例如每月,抑或每次财报集中发布之后?

应该从因子逻辑和回测结果出发,选择合适的调仓频率

12. 多因子模型回测过程中,是否应对个股特别设立平仓与开仓条件(即对多因子的结果进行修正)?如何做?

设置平仓线,可以免去极端个股走势对于策略的影响;既然是回测,那么可以很容易看出来这个影响有多大,然后综合设置

实盘1. 新策略从提出到开发,再到上线的流程中,历史回测(back-test)、实时模拟(paper-trading)和实盘交易(real-money)的关键差异何在,各自的优劣何在?

历史回测是为了验证想法,可以多参数验证;实时模拟和实盘交易其实差别不大,如果你的模拟系统能够非常贴近实际交易的话;实盘交易中,可能需要长时间的跟踪才能确定你的模型是否有效。

2. 如何检测你的模型是否已经失效?模型因子是否需要定期重选?

因子是否失效取决于因子计算的逻辑;定期重选就是现在很火的多因子轮动策略

3. 实盘中一个历史回测、实时模拟业绩都很好的策略发生了异常回撤,问题可能出在什么地方?应急预案是什么?

市场风格变换,政策影响等等

4. 如何设计数据库表结构来记录实盘交易流水和每日资产明细?

记录翔实即可

5. 在实盘交易中,模型给出的交易指令常常不能被精确地执行,如何评估其影响?

最简单地,分情况做历史统计,看统计意义上对结果影响是否显著

数据1. 基本信息、行情、基本面等基础数据库的表结构应该怎样设计?出于怎样的考虑?

基于数据频度等特征设计合理数据库表结构

2. 选择Mysql、SQL及其它数据库管理系统的利弊?

是否收费和性能好坏

3. 常见的数据来源有哪些,数据提供商有哪些,各有哪些优劣?

Tushare、优矿 免费

通联数据 便宜、服务好

国泰安 财务数据质量高

Wind 数据全

4. 用网页抓取生成的数据源的利弊?

利:免费的,弊:脏数据、不稳定

5. 如何支持多数据源?

自定义数据相关api

6. 每个数据具有三个关键日期,数据日期、公告日期、录入日期。对于不同类型的数据项,上述三个关键日期之间的时滞情况不同,请对不同情况分别举例。数据库应怎样设计以全息保存三种关键日期,并使历史回测结果更加逼真?

使用公告日期

7. 行业分类数据选用哪家的好?

自己做最好,做不来用申万行业或者中证行业

8. 发现一只股票的某个财务数据异常,怎样找到真值?

读财报检查

9. 如何记录基础数据的勘误历史?

以错误类型分门别类

10. 怎么进行数据清洗?拥有哪些异常行为的股票应该列入黑名单?

不同类型的数据,需要不同的清洗方法

程序1. 分析程序用MATLAB、Python、R、C++等语言各自的利弊?哪种背景和需求的人应该选择哪种语言?

MATALAB、Python、R做为前期模型研究的语言效率足够,也方便很多。C++在高频等性能要求比较高的地方有用武之地。简单来说,一般多因子研究,不需要踩C++这个坑吧

2. 10年历史回测,数据量大约是多少,运算量大约是多少?怎样的内存不会溢出?

只是行情财报数据,大概也就几个G的量级了,要是加上算好的成百上千的因子数据,可能会多一点。内存不够可以买啊,我司作为一个公益项目满足用户的所有幻想。

3. 面向过程的架构vs面向对象架构来实现多因子模型各有什么利弊?

两种都可以做。面向过程架构比较简单粗暴,但是灵活度不够、做更新时容易牵一发动全身;面向对象则需要计划好架构,这一步可能比较难,但完成之后的写程序就相对来说方便点,调试等等也要方便不少。

综合1. 股票市场是否存在alpha,怎样验证?

存在,不然那么多韭菜,谁来割

2. 传统的基本面投资方法与多因子模型都是为了得到股票组合,他们的异同是什么?

传统基本面投资和多因子模型,在选股方面并无本质区别。基本面的选股可以对行业和股票进行非常精细地研究;多因子模型优点在广度,另外对于各类风险有很系统的展示。

3. 多因子回归模型与CAPM理论和APT理论的关系是什么?

CAPM和APT出发点不一样,多因子模型更多地来自于APT理论

4. 一般的选股模型可以达到多少年化收益率和夏普比率?

抛开风险谈收益都是耍流氓,夏普比也不是一个好的衡量选股模型的指标,个人认为信息比率可能更加合理。以MultiFactors Alpha Model为例,过去七年回测年化阿尔法达到27%,夏普比才只有0.92,但是信息比达到3.79。

5. 在多因子模型的构造过程中,最核心的一个环节是什么?【我认为是预测收益率,也许有人认为是风险(跟踪误差)控制】

最核心的是预测收益率,最重要的是基础数据质量

6. 不同交易频率的组合投资策略——日内(高频、中频、低频)、日频、中期、长期,其对应的多因子模型有哪些不同?

最重要的区别当然是速度,日内高频的策略,如果因子计算依赖不好或者计算太慢,就没法做。很少见到有用多因子模型做日内高频

7. 为什么同样的策略,不同的执行者之间会存在无法抹去的误差(为什么你无法复制另一个人的研究报告成果)?

无法复制另一个人的研究报告成果,排除基础数据不一样这种技术原因,大部分都是因为研究报告根本没告诉你细节

8. 一般来说,多因子模型对数据敏感性很强,那么它的结果还有参考意义吗?

9. 多因子模型作为一个如此成熟的策略,为什么还有前仆后继的研究者?

个人觉得,多因子模型更多时候不是策略,而是产生策略的一套流程框架,作为策略的多因子模型其关键在于因子的研究

10. 基于多因子模型的策略收益没有吸引力,从业者众多,是夕阳产业吗?年轻人学习多因子模型是否值得?

担一份风险,博一份收益,多因子策略的绝对收益确实没有吸引力,但是重在风险控制。风险控制的好,规模做上去,还会没有吸引力吗

11. 机器学习、人工智能的工具可以应用到多因子模型的哪些地方?

具体的没有涉猎,这些工具在做多因子轮动策略时候可能会有用武之地

多因子相关文章推荐:

python行业中性_知乎相关推荐

  1. python行业中性_用Python分析指数: 11月16日热门指数Z值表

    衡量市场,指数高低是一个难题! 价值投资者很难知道,现在是高估,还是低估? 买的是便宜还是,贵了? 应该现在买/卖,还是再等等? 针对这个问题,我在网上看到了一些量化的处理方法.例如:平均数法,中位数 ...

  2. python行业中性_单因子测试(上)——因子中性化

    之前做了很多因子测试的工作,但一直没有总结,感觉很凌乱,决定花时间把这部分东西写一写,温故知新,也为后续学习打基础.首先写一下单因子测试部分,分三篇,数据预处理一篇, 回归法一篇,分层测试法一篇.本篇 ...

  3. python行业中性_【建投金工丁鲁明团队 经典回顾】:零基础python代码策略模型实战...

    原标题:[建投金工丁鲁明团队 经典回顾]:零基础python代码策略模型实战 编者按 本文<零基础python代码策略模型实战>,属于大数据选股领域,报告发布时间为2018年3月8日. 内 ...

  4. python行业中性_【量化课堂】因子研究系列之四 -- 市值与行业的中性化

    导语:本文给出以BP(账面市值比)为例的因子缩尾处理和对市值与行业中性化的处理实现代码,展现单因子不同分位处在不同处理方法下的表现. 本文是一系列因子研究中的第四篇文章.本系列的文章有: 引言 因子系 ...

  5. python行业中性_市场风险中性假设的r0只是等效r的其中之一

    市场风险中性假设的r0只是等效r的其中之一 于德浩 2020.6.23 在BS期权定价方程中,用到了一个市场风险中性假设,可后来人们发现,由此方程解出的期权价格C不仅适用于理想的市场风险中性条件,也符 ...

  6. python行业中性_用python进行金融市场文本数据的情感计算

    之前我依据一篇论文中的中文金融情感词典CFSD(chinese financial sentiment dictionary),中文金融领域情感词典构建, 整理成csv文件的情感词典.现在我们找点财经 ...

  7. 用python自动化办公_知乎1800赞 | 用Python自动化办公能做到哪些有趣或有用的事情?...

    原标题:知乎1800赞 | 用Python自动化办公能做到哪些有趣或有用的事情? 知友:陈廷聿(1800+ 赞同) 利益相关:Python办公自动化课程的讲师 我想介绍一下我是如何从每天工作8小时,进 ...

  8. python数据比例_知乎人均985?Python爬50W数据,BI做出可视化后,我有了答案

    一次完整的python数据分析流程是怎么样的? 使用python从网站抓取数据,并将这些数据保存到SQLite数据库中,然后对数据进行清洗,最后对数据进行数据可视化分析. 可是熟悉的人应该知道,pyt ...

  9. 30岁学python全栈_知乎热帖!戳痛100万程序员:我30岁了,我还能学Python吗?

    " 每个人对如何度过一生有着不同的答案,最重要的不是要不要"开始学习Python",而是认识你自己. --LEWIS " 最近,在知乎上看到关于30岁能不能学P ...

  10. python行业中性化怎么做_1行代码完成去极值、标准化、行业与市值中性化---以pb因子为例...

    使用pandas对算法进行了改进,速度比以前快了30倍. %%time # 导入函数库 import jqdata import numpy as np import pandas as pd imp ...

最新文章

  1. JVM class加载机制的总结 收藏
  2. Nginx在mvvm模式中的使用
  3. 每日一皮:当你开始研究一个新项目时是这样的吗?
  4. shell 中 if then语句中会跟着-ne -ge之类的参数的含义
  5. 十分钟教你开发EOS智能合约
  6. PHP-代码审计-审计第一步
  7. PAT-B 1015. 德才论(同PAT 1062. Talent and Virtue)
  8. 视觉目标检测和识别之过去,现在及可能
  9. LOJ 3156: 「NOI2019」回家路线
  10. matlab %3c handle,volume browser (updated).htm 源代码在线查看 - Matlab显式三维地震数据的源代码 资源下载 虫虫电子下载站...
  11. 支持windows 8的虚拟机软件
  12. php7安装详解、,php7安装详解(windows环境)
  13. 测度论与概率论基础学习笔记1——1.1 集合及其运算
  14. python绘制科赫曲线
  15. 实验七2021011122
  16. ArcEngine下纵断面图的绘制
  17. Caused by: java.lang.NoClassDefFoundError: Class not found using the boot class loader; no stack tra
  18. 计算机基础excel重点,计算机基础重点 (Excel ppt 网络基础)
  19. java计算机毕业设计临港新片区招商引资项目管理系统源代码+数据库+系统+lw文档
  20. HSV与RGB之间相互转换

热门文章

  1. ORACLE 锁解释
  2. 基于Python获取一些打印机简单信息
  3. python 全国内地高风险地区数量查询与可视化(分省)
  4. 互联网网站的反爬虫策略浅析
  5. 使用 WinRAR 将bat转exe
  6. 基于支付场景下的微服务改造与性能优化
  7. android 导航栏动画,使用Lottie动画实现底部导航栏
  8. 怎样通过计算机修改蓝牙音箱,蓝牙音箱怎么连接电脑(图文教程)
  9. 直方图均衡化 java,OpenCV Java 直方图均衡化
  10. 破解版本的Charles