读书笔记_中国期货市场量化交易(李尉)02
第四章 基础统计模型
金融数据(问题)和传统数据(问题)差异:传统数据(时序等)更稳定,金融更博弈,高噪
对机器学习模型影响:模型简单则无法学习充分,模拟复杂则容易过拟合。(个人补充:对所有机器学习都有这个问题,但特殊在与传统问题我们人类可以取得较好结果,大多情况下,我们可以对其进行针对优化(构造特征等),而金融数据,即使我们人类也无法对其进行准确描述和建模,所以也和难优化,即使对于是过拟合还是飞过拟合都无从判断(所谓过拟合和非过拟合,不能单单通过测试集准确率-验证集准确率>0or<0判断,应为凡是测试集准确率必定高于验证集合))。
金融数据R2较低,一般采用相对性筛选,排序选最好就行了。
p和t-value:传统统计指标在金融数据中也无需太关注,由于其不满足样本的独立性和一些概率分布的假设
机器学习处理金融是过拟合了,(个人认为这也是不对的,不确定作者怎么得到这个结论的,如果是测试集准确率大于验证集,那么所有机器学习问题都过拟合了,单独对金融数据申明这一点并不合适)
对于样本外不佳的处理:l1,l2正则化
ridge:解决过拟合,去掉不重要特征(大体没问题,但需要先做标准化和归一化,作者在书中并未提到,如果不进行标准化和归一化,这么做就是错误的)
lasso:解决过拟合,去掉不重要特征(这也是不对的,lasso主要是解决特征共线性的,而且lasso去掉的特征也不是不重要,而是和另一个特征高相关了,和特征本身重不重要没太大关系,对过拟合可能也有微弱削减,但削减其实依靠减少特征实现的,作用非常微弱)
第五章 复杂统计模型与机器学习
(拙见:这一章整个都在验证不同算法,但实际机器学习问题,7成工作是在做特征工程,特征工程才是机器学习问题的核心,可视化,分析,转换等,但作者这里完全没有提到,只是把算法当做黑箱套用,分析出较好算法)
gbm算法,随机森林等算法
跨品种因子:把类似品种的另一个产品因子也拿过来,当做本产品的因子使用(我大不大理解,这么做意义,个人以为副作用,引入无理由的高相关特征,容易过拟合)
传统数据相对金融数据优势:传统问题稳定(人类误差低,理论上可以处理的)。数据分布一致。信噪比高(这三点非常认同)
拙见:这一章和上一章很多细节都是需要在斟酌的,不准确的信息太多了。
读书笔记_中国期货市场量化交易(李尉)02相关推荐
- 读书笔记_中国期货市场量化交易(李尉)01
读书笔记,李尉的作品,看豆瓣还行就买来看看 第一章 期货基本策略概要 国内平台:开发,回测,模拟,实盘均在一个平台实现较为方便,并且费用较低. 连续合约:跳空问题 指数合约:无法直接交易 淘宝策略:低 ...
- 读书笔记_中国期货市场量化交易(李尉)05
第十一章 实盘交易的管理 simnow仿真交易平台:见价成交,滑点低于实际,手续费仅仅交易所手续费也低于实际 主力合约的换月:成交量,持仓量,换过不在换回 风险管理:正常回撤还是已失效 1,低位低波动 ...
- 读书笔记_中国期货市场量化交易(李尉)03
第六章 从预测到交易 因子评估:R^2,择优而用,同时需考虑时间因素,时间段波动小,收益可能无法覆盖手续费和滑点 最终评估:资金曲线 预测值的使用:假如是收益,可以当做仓位,高预测值高仓位,或按照马克 ...
- 读书笔记_中国期货市场量化交易(李尉)04
第八章 投资组合优化 马科维茨均值方差(历史敏感,仓位集中):有效前沿, 一般可以认为策略相关性比较稳定 组合可能有负值权重,不合理,可能需要做限制 约束条件越多,有效前沿曲线约不平滑,过拟合风险也较 ...
- 马丁福勒《UML精粹》读书笔记_第四章
第四章 顺序图 顺序图是一个use case的一种实现.当考察单个use case内部若干对象的行为时,就应使用顺序图. 可参考"高焕堂<嵌入式UML设计>读书笔记_第五章&qu ...
- 马丁福勒《UML精粹》读书笔记_第一章
马丁福勒<UML精粹>读书笔记_第一章 UML的使用场景 必须遵从UML规则吗? 在上述草图.蓝图的场景下,不必过多强调遵从UML规则.因为我们使用UML的目的是为了一个好的设计,所以应将 ...
- 读书笔记_量化交易如何建立自己的算法交易03
第6章 资金和风险管理 6.1 最优资本配置和杠杆 凯利公式说,最优化的承担风险的比例是 K = ( b*p - (1-p) )/b b是盈亏比(平均盈利/平均亏损) p是胜率( 盈利次数/总次数) ...
- 读书笔记_量化交易如何建立自己的算法交易01
这本书除了翻译的问题(翻译的不是很好,可能和太老有关系),内容和之前的也都有重叠,在一些干货内容上,比如策略评估,改进等和之前读过的书都很类似.也有可能是新书借鉴了老书,导致干货相似. 第1章 量化交 ...
- 读书笔记_打开量化投资的黑箱01
大约4年前(2015年左右),看过一些量化的入门书籍,那时是完全小白的,一窍不通的(当然,现在也不算牛,只能算比当时有进步吧).前阵子开发策略,开发的有点小心累,之前自以为很好的策略or思路,实践下来 ...
最新文章
- 如何使用pyecharts中自带的数据集?
- JavaScript HTML DOM - 改变 CSS
- 分享memcache和memcached安装过程(转)
- 多线程下HttpContext.Current 的问题
- MySQL中的SQL Mode及其作用
- VMware Workstation 端口映射 How to
- 【java版坦克大战---准备篇】 java 绘图
- android 跨进程 android:process,Android跨进程通信技术-多进程模式的运行机制
- DelphiXE开发坑
- java缩小pdf,如何使用Java缩小PDF文档中的内容?
- centos linux引导修复_CentOs7 修复 引导启动
- OLED屏幕应用实验
- please configure web facet first
- 如何调节B站倍速播放
- 树梅派应用25:宅男必备:配备电子纸屏幕的抽纸盒
- ROS自定义消息类型,编译无法生成 msg/srv 文件产生的头文件
- MySQLSyntaxErrorException sql语句语法错误
- P1486 [NOI2004]郁闷的出纳员
- 第三届北京·顺义张镇灶王文化节即将开幕
- 01博弈三要素和囚徒困境