2000年,美国著名经济学家罗伯特·席勒在《非理性繁荣》一书中指出:“我们应当牢记,股市定价并未形成一门完美的科学。”

回归分析 

pearson相关系数:

用来描述两组线性的数据一同变化移动的趋势。用数学公式表示,皮尔森相关系数等于两个变量的协方差除于两个变量的标准差。

通常情况下通过以下取值范围判断变量的相关强度:

相关系数 0.8-1.0 极强相关

0.6-0.8 强相关

0.4-0.6 中等程度相关

0.2-0.4 弱相关

0.0-0.2 极弱相关或无相关

线性回归模型:

参数解释:

x是自变量也是解释变量

y是因变量

xi是观测样本,yi是观测样本

1.一元线性回归

求解参数使用最小二乘法:找到合适的参数(斜率和截距),每一个实际的x对应一个预测y,使得所有预测y和实际y的平方和最小。利用统计软件进行求解α和β。

2.多元线性回归

一元回归在实际中并不适用,一般来说解释变量是多元的,所以大多使用多元回归且并不一定是线性的。这里先介绍多元线性回归,求解参数依然使用最小二乘法,使用软件完成求解。

检验方法

名词解释:拟合优度检验 Goodness of fit test

拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。度量拟合优度的统计量是R²。R²的值越接近1,说明回归直线对观测值的拟合程度越好。

R²等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比(在MATLAB中,R²=1-"回归平方和在总平方和中所占的比率")。因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。

利用Python statsmodels进行线性回归

代码操作使用Anaconda Jupyter Notebook,小编以最近比较关注的股票火炬电子(603678.SH)上证指数(000001.SH)为例进行介绍。数据采用了个股和市场指数一年内(2019-02-13至2020-02-13)的收盘价,通过东方财富Choice终端导入到Excel中。

导入模块和读取数据

绘制双轴图表现自该股票和上证指数的波动趋势

绘制当日涨跌幅直方图

绘制当日涨跌幅散点图

用statsmodels进行回归分析

参数解释:

R-square: 0.352

拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。R²最大值为1。R²的值越接近1,说明回归直线对观测值的拟合程度越好。

F-statistic: 130.5 

Prob (F-statistic): 2.04e-24 

F检验:解释变量的联合解释能力。Prob<0.05 模型可接受,说明模型是显著的。

r = 1.2030rm + 0.0012const

t可以用2进行估计比较,如果绝对值大于2或者P小于0.05就是显著的,rm是一个显著的解释变量,忽略常数项const

拟合直线预测

相 关 阅 读

指南 | 量化选股模型 with Python (1)

下一篇:

使用python进行Fama French 三因素模型检验

—责编:衣诺—

—推送:衣诺—

import warnings 

warnings.filterwarnings('ignore') #关闭警告

import numpy as np

import pandas as pd

import statsmodels.api as sm 

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei'] #字体设定

plt.rcParams['axes.unicode_minus']=False #正负号显示

python 回归 显著_指南 | 量化选股with Python(2) 回归分析相关推荐

  1. python与金融投资_金融量化投资与Python

    一.为什么选择Python? 闲谈 计算机姑娘是擅长进行科学计算的,本来她就是做这个的,只不过后来人们让她处理了很多文字内容罢了,乃至于现在有一些人认为她是用来打字写文章的(变成打字机了),忘记了她最 ...

  2. python画k线图 自定周期_【量化小讲堂- Python、pandas技巧系列】极简方法将日线数据转为周线、月线或其他周期...

    引言: 本系列帖子"量化小讲堂",通过实际案例教初学者使用python.pandas进行金融数据处理,希望能对大家有帮助. 想要快速.系统的学习量化知识,可以参与我与论坛合作开设的 ...

  3. Python实现行业轮动量化选股【附完整源码】

    编者荐语: 所谓山不转水转,行业中的动量也存在一定的轮换效应.今天给大家分享一篇来自<量化小白上分记>的研报复现文章,基于因子动量.波动率.偏度.峰度来刻画行业轮动,对于构建行业轮动量化选 ...

  4. python金融编程入门_【量化小讲堂- Python、pandas技巧系列】如何快速上手使用Python进行金融数据分析...

    如何快速上手使用Python进行金融数据分析 引言: 本系列帖子"量化小讲堂",通过实际案例教初学者使用python.pandas进行金融数据处理,希望能对大家有帮助. [必读文章 ...

  5. pep8 python 编码规范_「原创」「python自学笔记」python编码规范

    编码规范是学习一个语言前必须要了解的. Python采用PEP8作为编码规范,PEP是Python Enhancement Proposal(Python 增强建议书)的缩写,8代表的是Python代 ...

  6. python用户手册是什么_Wind量化平台-用户手册(Python).pdf

    Wind量化平台-用户手册(Python) --中国金融数据及工具首席服务商 9311509 Wind Python 数据及交易接口 Version 1.1 修订时间:2014.02.12 上海万得信 ...

  7. 怎么用python自制计算公式_手把手教你用python制作简易计算器,能够记录你使用的情况...

    话不多说,首先先看效果图,它能够记录你在使用过程中的历史,方便你查看是否有错: 接下来就仔细分析一下是如何制作的: 简易计算器 第一步:导入资源库 在过程中使用到了tkinter这个资源库,win+R ...

  8. python做运动控制_第一课:用Python操控小龟小车运动

    欢迎来到小龟的课堂,今天我们讲如何用小龟小车的车载Python控制小车运动. 如果小伙伴还不会使用小龟小车的Python编辑器的话,可以阅读这篇教程<如何使用小龟小车的Python编辑器> ...

  9. print python excel分隔_合并/拆分 Excel?Python、VBA轻松自动化

    作者 | Ryoko 来源 | 凹凸数据 当你收集了 n 个人的 EXCEL 记录表,需要将它们汇成一个总表时你会怎么做呢? 如果不通过技术手段,要一个个打开再复制粘贴也太麻烦了吧! 此时就需要一个通 ...

最新文章

  1. 2022-2028年中国油气勘探工程产业研究及前瞻分析报告
  2. Linux中Eclipse开发android的配置问题
  3. 2019元月新SAP项目落地记
  4. 留念,第一次在C中调用lua成功!
  5. 关于“INS-40922 Invalid Scan Name – Unresolvable to IP address”
  6. div+css+theme
  7. springcloud系列四 搭建服务模块重点讲解
  8. [Spring5]IOC容器_Bean管理注解方式_创建对象
  9. [蓝桥杯2016初赛]方格填数-next_permutation
  10. Diango博客--24.单元测试:测试评论应用
  11. linux 磁盘分配 简书,linux 磁盘分区
  12. mysql如何实现树状结构_实现树状结构的两种方法
  13. 什么样的人不适合互联网创业
  14. 中国可打印标签市场趋势报告、技术动态创新及市场预测
  15. get传输时,会将加号+ 转换为空格
  16. php tcp获取数据_php建立tcp服务请求数据双向通信问题
  17. word打印高清图片
  18. 3个方面:做好竞品数据分析!
  19. 作文组装计算机,组装电脑作文200字
  20. Output输出缓存区大小只有1024KB,超过大小限制的就会被清除

热门文章

  1. Java调用Python遇到的一系列问题与解决方案
  2. ASP.NET MVC 异常Exception拦截
  3. ABP学习 解决:Update-Database : 无法将“Update-Database”项识别为 cmdlet、函数、脚本文件或可运行程序的名称的问题
  4. Tomcat参数设置,解决内存溢出问题
  5. 处理错误:ORA-27101: shared memory realm does not exist 解决方案
  6. 您如何计算字符串中字符串(实际上是字符)的出现?
  7. 你什么时候使用git rebase而不是git merge?
  8. 批量过滤删除AD中的对象
  9. java多线程之API初探(一)
  10. 安装交叉工具链arm-linux-gcc