• 数据存储方式

    • .csv
    • NoSQL 存储文本
    • SQL 跟时间序列有关的金融数据
  • 数据格式

    • 交易所信息:上交所、深交所、标普
    • 数据来源
    • Ticker/sumbol
    • 价格
    • 企业行为(stock split/dividend adjustments)
    • 国家假日
  • 数据关注点:容易出错的地方

    • 企业行为
    • spikes用相关滤波器过滤噪点
    • 缺失数据
  • MySql数据库基础用法

    • 基本用法
  • 设计股票EOD数据的表

    • Exchange
    • DataVendor
    • Symbol
    • DailyPrice
  • 机器学习通俗理解

    • kernel与相似度

      在机器学习中,kernel与相似度是混合着用的。

      大部分的核的本质,是计算两个输入的相似度。

  • 时间序列分析

    时间序列分析比较偏传统的计量经济学。相比古老传统。与机器学习相比,在三五十个点(很小的数据量)上就可以做的。

    金融与计量经济领域的quant偏向于时间序列分析;机器学习是另一种做quant的手段,与时间序列分析是并列的一种手段。

    在获取读取数据的水平之后,最容易上手的是时间序列分析。时间序列分为两大类:

    1. Mean均值 如果时间序列是平稳的,有一个均值,产品价格围绕均值操作。

      如果是随机游走,下一刻的状态没法根据过往判断,那就没法在证券市场赚钱。单只股票的价格很可能就是随机游走。

      但是一个股票组合,可能不是随机游走的,也就有了研究的必要。

      • Mean Reversion and Ornstein-Uhlenbeck process

        • ADF Test
        • Hurst Exponent
      • Cointegrated Augmented Dickey-Fuller Test
    2. Momentum动量

    具体参见:《时间序列分析与量化交易(1)》

  • Machine learning:A different Approach

Y=f(x)+eY=f(x) + e Y=f(x)+e

所有监督式机器学习,都可以看作:

  1. 有了一个对x(x1,x2,x3...xn)x(x_1,x_2,x_3...x_n)x(x1​,x2​,x3​...xn​)feature的定义
  2. 有足够data
  3. 确定一个model
  4. 学出一个最好的Model

常用的Model:

  1. Logistic Regression:分类
  2. SVM:both(分类、回归)。目标是找到最大分离界面
  3. Random Forest:both(分类、回归)
  4. LSTM(高级的RNN。能用HMM的都可以用LSTM):both(分类、回归)
  5. Lasso.可以自动选择feature,对于脏数据是比较好的;但是如果是一个已经选好feature的数据,就不适合了。

正则化是针对模型而言;归一化是针对数据而言。

统计学中的大数定律,30个点就可以算是大数。

机器学习与量化交易∙笔记(3)相关推荐

  1. 4天掌握python量化交易_【量化】4天学会python机器学习与量化交易-笔记1(p6~p10)

    文章目录 p6 获取板块.交易行情数据 p7 获取财务数据与定时器 p8 投资组合与交易 p9 策略的收益指标 p10 策略风险指标 视频:4天学会python机器学习与量化交易 平台:米筐 4天学会 ...

  2. 投资必读书籍-机器学习与量化交易

    投资理念 <开放社会及其敌人>卡尔⋅\cdot⋅波普尔,索罗斯的导师 <通往奴役之路>弗里德里希⋅\cdot⋅奥古斯特⋅\cdot⋅冯⋅\cdot⋅哈耶克 <原则> ...

  3. python定价_Python|机器学习与量化交易、定价高级训练营陆家嘴学

    Python|机器学习与量化交易.定价高级训练营陆家嘴学堂百度云下载 我买了这个课程,在此分享! 获取课程,请加幑信: 1403905263 (复制幑信号到幑信添加!) 或者扫下面码 <韩非子& ...

  4. AI和机器学习对量化交易领域的影响

    本文为Michael Harris 在欧洲作为邀请嘉宾为高净值客户和交易者所做的一场演讲概要,主题为"人工智能与机器学习将对交易与投资产生的巨大影响".文章主要从四个方面进行阐释, ...

  5. Python机器学习与量化交易

    文章目录 1. 量化交易简介 1.1 量化交易的历史 1.2 什么是量化交易 1.3 量化交易分类 1.4 金融产品及衍生品的投资策略 1.5 量化交易的优势 1.6 如何做量化交易项目 2. 量化回 ...

  6. 机器学习之量化交易-获取最大收益

    1.选择好投资标的 2.利用机器学习获取最佳运行参数 3.进行量化交易 4.累计获利 import tushare as ts # 引入股票基本数据相关库 import numpy as np imp ...

  7. 【Python量化交易笔记】股票数据获取 (一)

    获取股票数据主要是靠网页爬虫或者现成的库. 关于股票数据获取,python的接口有非常多,教程也有很多. 最后我选择了使用tushare和baostock.由于tushare升级之后有积分限制,很多数 ...

  8. 【量化交易笔记】1.数据来源

    简介 数据是机器学习的核心,garbage in garbage out,而金融数据是量化的基础,对数据提出了更高的要求.不仅是数据准确高速(稳定),而且要求数据丰富全面. 金融数据 考虑到金融数据非 ...

  9. 【量化交易笔记】6.布林带的实现

    上一讲介绍A股移动平均值(MA)指标,本讲我们来讲解布林布的实现. 布林线(BOLL)技术指标简介 布林线(Bollinger Bands,BOLL)又称布林带,是约翰·布林(John Bolling ...

最新文章

  1. STL源码剖析之算法:lower_bound
  2. 六十、第一个SpringBoot的 helloworld程序
  3. 团队任务3:软件设计与开发准备
  4. [入门]理想的小白程序员成长曲线
  5. jQuery Ajax POST方法
  6. 初学Spring Boot
  7. Linux 下的Core Dump
  8. python写乘法口诀表好记方法_如何用python编写乘法口诀表
  9. 鹿晗都有 AI 粉了,为什么 AI 换脸剧的效果还这么渣?
  10. win8.1 64位安装oracle10g客户端心得
  11. 下载哨兵1精轨数据教程
  12. axios 封装数据请求
  13. html5获取经纬度页面,html5获取经纬度
  14. 用Xbox360游戏手柄通过python代码控制树莓派4B点亮LED灯
  15. 025_GPIO的读
  16. “瘦瘦”让健康管理流行起来
  17. 教你用VS Code插件实现五彩斑斓的伪代码
  18. mysql查询最高分学生年龄_MySQL练习题student_score
  19. web网页设计实例作业 ——古典中国风工艺美术(9页) html+css+javascript网页设计实例
  20. 笛卡尔树简介(分类到treap里面)

热门文章

  1. 便利商店二中文版.EXE
  2. 如何获得所有汉字_汉字听写大会福州市台江第六中心小学校园晋级赛圆满落幕!...
  3. Nginx 安全配置
  4. android 快盘接口,大容量网络硬盘 Android金山快盘试用体验
  5. 《中国科技纵横》杂志
  6. python来写打飞机
  7. 基于RK3288的双屏异显实现
  8. 慕课网vuejs开发饿了么APP的知识总结
  9. 我新来的请大家多多指教
  10. 【考研日记】:感恩蛋疼以及其他事