第四章 基础统计模型

金融数据(问题)和传统数据(问题)差异:传统数据(时序等)更稳定,金融更博弈,高噪
对机器学习模型影响:模型简单则无法学习充分,模拟复杂则容易过拟合。(个人补充:对所有机器学习都有这个问题,但特殊在与传统问题我们人类可以取得较好结果,大多情况下,我们可以对其进行针对优化(构造特征等),而金融数据,即使我们人类也无法对其进行准确描述和建模,所以也和难优化,即使对于是过拟合还是飞过拟合都无从判断(所谓过拟合和非过拟合,不能单单通过测试集准确率-验证集准确率>0or<0判断,应为凡是测试集准确率必定高于验证集合))。
金融数据R2较低,一般采用相对性筛选,排序选最好就行了。
p和t-value:传统统计指标在金融数据中也无需太关注,由于其不满足样本的独立性和一些概率分布的假设
机器学习处理金融是过拟合了,(个人认为这也是不对的,不确定作者怎么得到这个结论的,如果是测试集准确率大于验证集,那么所有机器学习问题都过拟合了,单独对金融数据申明这一点并不合适)
对于样本外不佳的处理:l1,l2正则化

ridge:解决过拟合,去掉不重要特征(大体没问题,但需要先做标准化和归一化,作者在书中并未提到,如果不进行标准化和归一化,这么做就是错误的)
lasso:解决过拟合,去掉不重要特征(这也是不对的,lasso主要是解决特征共线性的,而且lasso去掉的特征也不是不重要,而是和另一个特征高相关了,和特征本身重不重要没太大关系,对过拟合可能也有微弱削减,但削减其实依靠减少特征实现的,作用非常微弱)

第五章 复杂统计模型与机器学习

(拙见:这一章整个都在验证不同算法,但实际机器学习问题,7成工作是在做特征工程,特征工程才是机器学习问题的核心,可视化,分析,转换等,但作者这里完全没有提到,只是把算法当做黑箱套用,分析出较好算法)
gbm算法,随机森林等算法
跨品种因子:把类似品种的另一个产品因子也拿过来,当做本产品的因子使用(我大不大理解,这么做意义,个人以为副作用,引入无理由的高相关特征,容易过拟合)
传统数据相对金融数据优势:传统问题稳定(人类误差低,理论上可以处理的)。数据分布一致。信噪比高(这三点非常认同)
拙见:这一章和上一章很多细节都是需要在斟酌的,不准确的信息太多了。

读书笔记_中国期货市场量化交易(李尉)02相关推荐

  1. 读书笔记_中国期货市场量化交易(李尉)01

    读书笔记,李尉的作品,看豆瓣还行就买来看看 第一章 期货基本策略概要 国内平台:开发,回测,模拟,实盘均在一个平台实现较为方便,并且费用较低. 连续合约:跳空问题 指数合约:无法直接交易 淘宝策略:低 ...

  2. 读书笔记_中国期货市场量化交易(李尉)05

    第十一章 实盘交易的管理 simnow仿真交易平台:见价成交,滑点低于实际,手续费仅仅交易所手续费也低于实际 主力合约的换月:成交量,持仓量,换过不在换回 风险管理:正常回撤还是已失效 1,低位低波动 ...

  3. 读书笔记_中国期货市场量化交易(李尉)03

    第六章 从预测到交易 因子评估:R^2,择优而用,同时需考虑时间因素,时间段波动小,收益可能无法覆盖手续费和滑点 最终评估:资金曲线 预测值的使用:假如是收益,可以当做仓位,高预测值高仓位,或按照马克 ...

  4. 读书笔记_中国期货市场量化交易(李尉)04

    第八章 投资组合优化 马科维茨均值方差(历史敏感,仓位集中):有效前沿, 一般可以认为策略相关性比较稳定 组合可能有负值权重,不合理,可能需要做限制 约束条件越多,有效前沿曲线约不平滑,过拟合风险也较 ...

  5. 马丁福勒《UML精粹》读书笔记_第四章

    第四章 顺序图 顺序图是一个use case的一种实现.当考察单个use case内部若干对象的行为时,就应使用顺序图. 可参考"高焕堂<嵌入式UML设计>读书笔记_第五章&qu ...

  6. 马丁福勒《UML精粹》读书笔记_第一章

    马丁福勒<UML精粹>读书笔记_第一章 UML的使用场景 必须遵从UML规则吗? 在上述草图.蓝图的场景下,不必过多强调遵从UML规则.因为我们使用UML的目的是为了一个好的设计,所以应将 ...

  7. 读书笔记_量化交易如何建立自己的算法交易03

    第6章 资金和风险管理 6.1 最优资本配置和杠杆 凯利公式说,最优化的承担风险的比例是 K = ( b*p - (1-p) )/b b是盈亏比(平均盈利/平均亏损) p是胜率( 盈利次数/总次数) ...

  8. 读书笔记_量化交易如何建立自己的算法交易01

    这本书除了翻译的问题(翻译的不是很好,可能和太老有关系),内容和之前的也都有重叠,在一些干货内容上,比如策略评估,改进等和之前读过的书都很类似.也有可能是新书借鉴了老书,导致干货相似. 第1章 量化交 ...

  9. 读书笔记_打开量化投资的黑箱01

    大约4年前(2015年左右),看过一些量化的入门书籍,那时是完全小白的,一窍不通的(当然,现在也不算牛,只能算比当时有进步吧).前阵子开发策略,开发的有点小心累,之前自以为很好的策略or思路,实践下来 ...

最新文章

  1. 如何使用pyecharts中自带的数据集?
  2. JavaScript HTML DOM - 改变 CSS
  3. 分享memcache和memcached安装过程(转)
  4. 多线程下HttpContext.Current 的问题
  5. MySQL中的SQL Mode及其作用
  6. VMware Workstation 端口映射 How to
  7. 【java版坦克大战---准备篇】 java 绘图
  8. android 跨进程 android:process,Android跨进程通信技术-多进程模式的运行机制
  9. DelphiXE开发坑
  10. java缩小pdf,如何使用Java缩小PDF文档中的内容?
  11. centos linux引导修复_CentOs7 修复 引导启动
  12. OLED屏幕应用实验
  13. please configure web facet first
  14. 如何调节B站倍速播放
  15. 树梅派应用25:宅男必备:配备电子纸屏幕的抽纸盒
  16. ROS自定义消息类型,编译无法生成 msg/srv 文件产生的头文件
  17. MySQLSyntaxErrorException sql语句语法错误
  18. P1486 [NOI2004]郁闷的出纳员
  19. 第三届北京·顺义张镇灶王文化节即将开幕
  20. 01博弈三要素和囚徒困境

热门文章

  1. python入门——P48魔法方法:迭代器
  2. Spring IOC容器的依赖注入流程(收集和注册、分析和组装)
  3. Linux 高级流量控制
  4. SQL FILESTREAM和SQL Server全文搜索
  5. 华为指标OceanStore
  6. delphi FastReport 安装方法
  7. 数据结构与算法---导论
  8. [转]Winform不规则窗体的实现心得
  9. Google 的论坛
  10. struts2中的constant配置详解