机器学习与量化交易∙笔记(3)
数据存储方式
- .csv
- NoSQL 存储文本
- SQL 跟时间序列有关的金融数据
数据格式
- 交易所信息:上交所、深交所、标普
- 数据来源
- Ticker/sumbol
- 价格
- 企业行为(stock split/dividend adjustments)
- 国家假日
数据关注点:容易出错的地方
- 企业行为
- spikes用相关滤波器过滤噪点
- 缺失数据
MySql数据库基础用法
- 基本用法
设计股票EOD数据的表
- Exchange
- DataVendor
- Symbol
- DailyPrice
机器学习通俗理解
kernel与相似度
在机器学习中,kernel与相似度是混合着用的。
大部分的核的本质,是计算两个输入的相似度。
时间序列分析
时间序列分析比较偏传统的计量经济学。相比古老传统。与机器学习相比,在三五十个点(很小的数据量)上就可以做的。
金融与计量经济领域的quant偏向于时间序列分析;机器学习是另一种做quant的手段,与时间序列分析是并列的一种手段。
在获取读取数据的水平之后,最容易上手的是时间序列分析。时间序列分为两大类:
Mean均值
如果时间序列是平稳的,有一个均值,产品价格围绕均值操作。如果是随机游走,下一刻的状态没法根据过往判断,那就没法在证券市场赚钱。单只股票的价格很可能就是随机游走。
但是一个股票组合,可能不是随机游走的,也就有了研究的必要。
- Mean Reversion and Ornstein-Uhlenbeck process
- ADF Test
- Hurst Exponent
- Cointegrated Augmented Dickey-Fuller Test
- Mean Reversion and Ornstein-Uhlenbeck process
Momentum动量
具体参见:《时间序列分析与量化交易(1)》
Machine learning:A different Approach
Y=f(x)+eY=f(x) + e Y=f(x)+e
所有监督式机器学习,都可以看作:
- 有了一个对x(x1,x2,x3...xn)x(x_1,x_2,x_3...x_n)x(x1,x2,x3...xn)feature的定义
- 有足够data
- 确定一个model
- 学出一个最好的Model
常用的Model:
- Logistic Regression:分类
- SVM:both(分类、回归)。目标是找到最大分离界面
- Random Forest:both(分类、回归)
- LSTM(高级的RNN。能用HMM的都可以用LSTM):both(分类、回归)
- Lasso.可以自动选择feature,对于脏数据是比较好的;但是如果是一个已经选好feature的数据,就不适合了。
正则化是针对模型而言;归一化是针对数据而言。
统计学中的大数定律,30个点就可以算是大数。
机器学习与量化交易∙笔记(3)相关推荐
- 4天掌握python量化交易_【量化】4天学会python机器学习与量化交易-笔记1(p6~p10)
文章目录 p6 获取板块.交易行情数据 p7 获取财务数据与定时器 p8 投资组合与交易 p9 策略的收益指标 p10 策略风险指标 视频:4天学会python机器学习与量化交易 平台:米筐 4天学会 ...
- 投资必读书籍-机器学习与量化交易
投资理念 <开放社会及其敌人>卡尔⋅\cdot⋅波普尔,索罗斯的导师 <通往奴役之路>弗里德里希⋅\cdot⋅奥古斯特⋅\cdot⋅冯⋅\cdot⋅哈耶克 <原则> ...
- python定价_Python|机器学习与量化交易、定价高级训练营陆家嘴学
Python|机器学习与量化交易.定价高级训练营陆家嘴学堂百度云下载 我买了这个课程,在此分享! 获取课程,请加幑信: 1403905263 (复制幑信号到幑信添加!) 或者扫下面码 <韩非子& ...
- AI和机器学习对量化交易领域的影响
本文为Michael Harris 在欧洲作为邀请嘉宾为高净值客户和交易者所做的一场演讲概要,主题为"人工智能与机器学习将对交易与投资产生的巨大影响".文章主要从四个方面进行阐释, ...
- Python机器学习与量化交易
文章目录 1. 量化交易简介 1.1 量化交易的历史 1.2 什么是量化交易 1.3 量化交易分类 1.4 金融产品及衍生品的投资策略 1.5 量化交易的优势 1.6 如何做量化交易项目 2. 量化回 ...
- 机器学习之量化交易-获取最大收益
1.选择好投资标的 2.利用机器学习获取最佳运行参数 3.进行量化交易 4.累计获利 import tushare as ts # 引入股票基本数据相关库 import numpy as np imp ...
- 【Python量化交易笔记】股票数据获取 (一)
获取股票数据主要是靠网页爬虫或者现成的库. 关于股票数据获取,python的接口有非常多,教程也有很多. 最后我选择了使用tushare和baostock.由于tushare升级之后有积分限制,很多数 ...
- 【量化交易笔记】1.数据来源
简介 数据是机器学习的核心,garbage in garbage out,而金融数据是量化的基础,对数据提出了更高的要求.不仅是数据准确高速(稳定),而且要求数据丰富全面. 金融数据 考虑到金融数据非 ...
- 【量化交易笔记】6.布林带的实现
上一讲介绍A股移动平均值(MA)指标,本讲我们来讲解布林布的实现. 布林线(BOLL)技术指标简介 布林线(Bollinger Bands,BOLL)又称布林带,是约翰·布林(John Bolling ...
最新文章
- STL源码剖析之算法:lower_bound
- 六十、第一个SpringBoot的 helloworld程序
- 团队任务3:软件设计与开发准备
- [入门]理想的小白程序员成长曲线
- jQuery Ajax POST方法
- 初学Spring Boot
- Linux 下的Core Dump
- python写乘法口诀表好记方法_如何用python编写乘法口诀表
- 鹿晗都有 AI 粉了,为什么 AI 换脸剧的效果还这么渣?
- win8.1 64位安装oracle10g客户端心得
- 下载哨兵1精轨数据教程
- axios 封装数据请求
- html5获取经纬度页面,html5获取经纬度
- 用Xbox360游戏手柄通过python代码控制树莓派4B点亮LED灯
- 025_GPIO的读
- “瘦瘦”让健康管理流行起来
- 教你用VS Code插件实现五彩斑斓的伪代码
- mysql查询最高分学生年龄_MySQL练习题student_score
- web网页设计实例作业 ——古典中国风工艺美术(9页) html+css+javascript网页设计实例
- 笛卡尔树简介(分类到treap里面)