python 回归 显著_指南 | 量化选股with Python(2) 回归分析
2000年,美国著名经济学家罗伯特·席勒在《非理性繁荣》一书中指出:“我们应当牢记,股市定价并未形成一门完美的科学。”
回归分析
pearson相关系数:
用来描述两组线性的数据一同变化移动的趋势。用数学公式表示,皮尔森相关系数等于两个变量的协方差除于两个变量的标准差。
通常情况下通过以下取值范围判断变量的相关强度:
相关系数 0.8-1.0 极强相关
0.6-0.8 强相关
0.4-0.6 中等程度相关
0.2-0.4 弱相关
0.0-0.2 极弱相关或无相关
线性回归模型:
参数解释:
x是自变量也是解释变量
y是因变量
xi是观测样本,yi是观测样本
1.一元线性回归
求解参数使用最小二乘法:找到合适的参数(斜率和截距),每一个实际的x对应一个预测y,使得所有预测y和实际y的平方和最小。利用统计软件进行求解α和β。
2.多元线性回归
一元回归在实际中并不适用,一般来说解释变量是多元的,所以大多使用多元回归且并不一定是线性的。这里先介绍多元线性回归,求解参数依然使用最小二乘法,使用软件完成求解。
检验方法
名词解释:拟合优度检验 Goodness of fit test
拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。度量拟合优度的统计量是R²。R²的值越接近1,说明回归直线对观测值的拟合程度越好。
R²等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比(在MATLAB中,R²=1-"回归平方和在总平方和中所占的比率")。因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。
利用Python statsmodels进行线性回归
代码操作使用Anaconda Jupyter Notebook,小编以最近比较关注的股票火炬电子(603678.SH)和上证指数(000001.SH)为例进行介绍。数据采用了个股和市场指数一年内(2019-02-13至2020-02-13)的收盘价,通过东方财富Choice终端导入到Excel中。
导入模块和读取数据
绘制双轴图表现自该股票和上证指数的波动趋势
绘制当日涨跌幅直方图
绘制当日涨跌幅散点图
用statsmodels进行回归分析
参数解释:
R-square: 0.352
拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。R²最大值为1。R²的值越接近1,说明回归直线对观测值的拟合程度越好。
F-statistic: 130.5
Prob (F-statistic): 2.04e-24
F检验:解释变量的联合解释能力。Prob<0.05 模型可接受,说明模型是显著的。
r = 1.2030rm + 0.0012const
t可以用2进行估计比较,如果绝对值大于2或者P小于0.05就是显著的,rm是一个显著的解释变量,忽略常数项const
拟合直线预测
相 关 阅 读
指南 | 量化选股模型 with Python (1)
下一篇:
使用python进行Fama French 三因素模型检验
—责编:衣诺—
—推送:衣诺—
import warnings
warnings.filterwarnings('ignore') #关闭警告
import numpy as np
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #字体设定
plt.rcParams['axes.unicode_minus']=False #正负号显示
python 回归 显著_指南 | 量化选股with Python(2) 回归分析相关推荐
- python与金融投资_金融量化投资与Python
一.为什么选择Python? 闲谈 计算机姑娘是擅长进行科学计算的,本来她就是做这个的,只不过后来人们让她处理了很多文字内容罢了,乃至于现在有一些人认为她是用来打字写文章的(变成打字机了),忘记了她最 ...
- python画k线图 自定周期_【量化小讲堂- Python、pandas技巧系列】极简方法将日线数据转为周线、月线或其他周期...
引言: 本系列帖子"量化小讲堂",通过实际案例教初学者使用python.pandas进行金融数据处理,希望能对大家有帮助. 想要快速.系统的学习量化知识,可以参与我与论坛合作开设的 ...
- Python实现行业轮动量化选股【附完整源码】
编者荐语: 所谓山不转水转,行业中的动量也存在一定的轮换效应.今天给大家分享一篇来自<量化小白上分记>的研报复现文章,基于因子动量.波动率.偏度.峰度来刻画行业轮动,对于构建行业轮动量化选 ...
- python金融编程入门_【量化小讲堂- Python、pandas技巧系列】如何快速上手使用Python进行金融数据分析...
如何快速上手使用Python进行金融数据分析 引言: 本系列帖子"量化小讲堂",通过实际案例教初学者使用python.pandas进行金融数据处理,希望能对大家有帮助. [必读文章 ...
- pep8 python 编码规范_「原创」「python自学笔记」python编码规范
编码规范是学习一个语言前必须要了解的. Python采用PEP8作为编码规范,PEP是Python Enhancement Proposal(Python 增强建议书)的缩写,8代表的是Python代 ...
- python用户手册是什么_Wind量化平台-用户手册(Python).pdf
Wind量化平台-用户手册(Python) --中国金融数据及工具首席服务商 9311509 Wind Python 数据及交易接口 Version 1.1 修订时间:2014.02.12 上海万得信 ...
- 怎么用python自制计算公式_手把手教你用python制作简易计算器,能够记录你使用的情况...
话不多说,首先先看效果图,它能够记录你在使用过程中的历史,方便你查看是否有错: 接下来就仔细分析一下是如何制作的: 简易计算器 第一步:导入资源库 在过程中使用到了tkinter这个资源库,win+R ...
- python做运动控制_第一课:用Python操控小龟小车运动
欢迎来到小龟的课堂,今天我们讲如何用小龟小车的车载Python控制小车运动. 如果小伙伴还不会使用小龟小车的Python编辑器的话,可以阅读这篇教程<如何使用小龟小车的Python编辑器> ...
- print python excel分隔_合并/拆分 Excel?Python、VBA轻松自动化
作者 | Ryoko 来源 | 凹凸数据 当你收集了 n 个人的 EXCEL 记录表,需要将它们汇成一个总表时你会怎么做呢? 如果不通过技术手段,要一个个打开再复制粘贴也太麻烦了吧! 此时就需要一个通 ...
最新文章
- 2022-2028年中国油气勘探工程产业研究及前瞻分析报告
- Linux中Eclipse开发android的配置问题
- 2019元月新SAP项目落地记
- 留念,第一次在C中调用lua成功!
- 关于“INS-40922 Invalid Scan Name – Unresolvable to IP address”
- div+css+theme
- springcloud系列四 搭建服务模块重点讲解
- [Spring5]IOC容器_Bean管理注解方式_创建对象
- [蓝桥杯2016初赛]方格填数-next_permutation
- Diango博客--24.单元测试:测试评论应用
- linux 磁盘分配 简书,linux 磁盘分区
- mysql如何实现树状结构_实现树状结构的两种方法
- 什么样的人不适合互联网创业
- 中国可打印标签市场趋势报告、技术动态创新及市场预测
- get传输时,会将加号+ 转换为空格
- php tcp获取数据_php建立tcp服务请求数据双向通信问题
- word打印高清图片
- 3个方面:做好竞品数据分析!
- 作文组装计算机,组装电脑作文200字
- Output输出缓存区大小只有1024KB,超过大小限制的就会被清除
热门文章
- Java调用Python遇到的一系列问题与解决方案
- ASP.NET MVC 异常Exception拦截
- ABP学习 解决:Update-Database : 无法将“Update-Database”项识别为 cmdlet、函数、脚本文件或可运行程序的名称的问题
- Tomcat参数设置,解决内存溢出问题
- 处理错误:ORA-27101: shared memory realm does not exist 解决方案
- 您如何计算字符串中字符串(实际上是字符)的出现?
- 你什么时候使用git rebase而不是git merge?
- 批量过滤删除AD中的对象
- java多线程之API初探(一)
- 安装交叉工具链arm-linux-gcc