文章福利:Python学习精选书籍10本


建立回归模型的一般步骤如下图


1、具体(社会经济)问题

当我们想去解决一些现实生活、经济问题时,需要将具体问题量化成数据,然后通过观察与揭示事物(数据)之间的内在联系得出规律,从而达到解决现实经济问题(及时止损、预测),奔着这个目标产生了一些列的可行性问题。


2、设置指标变量(量化具体问题)

可行性问题已经产生,接下来就要根据问题研究的目的设置因变量 y ,然后选取一些和因变量y有统计关系的自变量 x1、x2...

这里一定要明确一点:什么是因变量 y 和自变量 x,其实通俗来理解就是下图中的因果关系

我们需要通过经济变量(要研究的) '果' 选出一些影响它且合理的变量 '因',在回归模型中对于这两类变量有一些术语需要了解

因变量(果)也被称为被解释变量、内生变量;

自变量(因)也被称为解释变量、外生变量;

注意01:在变量选择这一块,研究不同的问题领域跨度大、专业性强,对于完全不了解的领域需要和这方面的专家、或者有经验的人士询问合作。这样可以更好的帮助我们确定研究问题的模型变量,做到不耻下问 。

注意02:回归模型的解释变量选取个数上并不是越多越好,若选取的变量之间有较大的信息重叠,就会出现共线性问题,并且变量多导致的计算量大,误差也大,进而导致最终模型参数精度也不高。

一般在选取指标变量时往往不能一次完全正确,需要反复调整找到最合适的指标变量。


3、收集、整理数据

指标确定之后,接下来就是搜集需要的指标数据了。要搜集样本数据可分为时间序列数据和横截面数据。

时间序列数据:

时间序列数据就是按照时间顺序排列数据,如下图,各指标数据跟着时间在变化:

横截面数据:

横截面数据即在同一时间截面上统计的数据集,如2018年我国各省市GDP数据

注意点:时间序列数据容易产生随机误差项的序列相关(处理方法:差分法)


4、回归模型的确定

上一步骤中,数据已经准备好,接下来就要从这些数据中提炼出一套宇宙公式--回归模型(数学形式)。首先第一步我们需要在笛卡尔坐标系中画出这些样本点的散点图,

为什么要先画散点图呢?我们知道回归模型的种类有多种,如线性回归、非线性回归...。画出散点图,我们可以根据散点图的分布形式大致确定该建立哪一种回归模型才是较合适的。

如果根据散点图实在无法确定模型的形式时,则可以将有争议的模型分别进模拟,然后从模拟结果中选出模拟效果最好的一个作为最终的理论回归模型。


5、模型参数估计

当回归模型的的具体分类选取确定后,接下来就要对模型中的未知参数进行估计,常见的也是最最经典的参数估计方法为:最小二乘法。

在最小二乘法的基础上又衍生出了偏最小二乘法、主成分回归、岭回归等,他们都是为了解决不满足模型基本假设而衍生出来的新方法。


6、模型检验与修改

初步的回归模型建立好后,还不能直接用于实际应用,模型是否正确解释问题指标之间的因果关系还是个未知数,此时需要去检验模型的可行性。

通常对模拟有效性的检验有两种方法:

1 统计性检验

2 具体问题(经济)意义检验

模型侧面揭示了具体的社会经济问题,例如我国GDP增长量与银行贷款发放量、耗电量等之间的关系从经济理论是上看是正相关关系,但是模型中的回归系数若为负数,则这个模型也是没有意义的。造成这种现象的原因可能有:自变量之间存在多重共线性、数据质量问题等。

模型需要通过统计检验和经济意义检验共同检验通过后才是有效可行的。


7、回归模型的应用

经过以上的种种九九八十一难,终于可以将该模型用于实际生活、经济问题上了。

我们可以从模型的回归系数上发现所研究的变量之间的结构关系,从而给出量化后的评价与建议。

调控:确定好的回归模型反馈了经济变量之间的因果关系后,根据已知结果的情况下调整具体的经济指标数据等。

例如:为了降低通货膨胀指标为5%以下,可以根据回归模型确定货币发行量、银行的存款利率等。

预测:可以根据回归模型预测我国2022年的国民收入等。

以上几个步骤就是一个回归模型建立到使用的全部流程,模型的修改往往要反复修正后才能得到一个理想模型。这个反反复复修改模型的过程可以从写论文中感触到。

--- END ---

更多精彩内容请关注 公众号:数据与编程之美

原文地址:建立回归模型的完整步骤

建立回归模型的完整步骤相关推荐

  1. 如何在Python中建立回归模型

    数据科学 (DATA SCIENCE) If you are an aspiring data scientist or a veteran data scientist, this article ...

  2. 数据分析-建立回归模型的流程

    一.明确需求(因变量y) 二.数据清洗 缺失值处理 异常值处理:一般大于3倍标准差的值视为异常值 分类变量的处理:将分类变量改为多列进行处理 备注:异常值一般不要直接处理,了解一下是什么情况再行处理, ...

  3. python建立回归模型_简单线性回归的Python建模方法

    简单线性回归,就是两个随机变量存在一定大小的相关系数的前提下,结合散点图观察,采用最小二乘OLS方法,尝试建立一条回归直线,使得误差平方和SSE最小.OLS是一种参数方法,通过确定直线的斜率b和截距a ...

  4. MATLAB建立回归模型

    终于考完数值分析和数理统计了,回来更新MATLAB 回归分析 在MATLAB的绘图里面其实有工具箱可以直接拟合数据,不过我们还是来看下代码简单拟合的方式. 1.一元线性回归 例如 有下列两组数据 x= ...

  5. 第五章 逻辑回归模型在评分卡开发中的应用

    逻辑回归模型在评分卡开发中的应用 课程简介:在分类场景中,逻辑回归模型是常用的一类算法.它具有结构简单.可解释性强.输出结果是"软分类"的特点.评分模型多采用这类算法.同时逻辑回归 ...

  6. 怎么用python进行回归预测_使用Python训练回归模型并进行预测

    摘要:本篇文章将介绍在python中使用机器学习库sklearn建立简单回归模型的过程. 回归分析是一种常见的统计方法,用于确定不同变量间的相互关系.在Excel中可以通过数据分析菜单中的回归功能快速 ...

  7. 简单数据预测—使用Python训练回归模型并进行预测(转自蓝鲸网站分析博客)

     使用Python训练回归模型并进行预测 回归分析是一种常见的统计方法,用于确定不同变量间的相互关系.在Excel中可以通过数据分析菜单中的回归功能快速完成.本篇文章将介绍在python中使用机器 ...

  8. 常用于评价回归模型优劣的统计量包括( )。_第四十一讲 R-判断回归模型性能的指标...

    当回归模型建立好以后,如何评价该回归模型是否与另一个回归模型有区别,如何比较两个回归模型的性能?这一讲中,我们将给大家介绍几个评价回归模型性能的统计指标. 1. 模型性能指标 在回归模型中,最常用的评 ...

  9. ewiews面板回归模型操作_EViews操作指南:eviews面板数据回归分析

    计量经济学实验指导书 实验一 EViews软件的基本操作 [实验目的] 了解EViews软件的基本功能,掌握软件的基本操作. [实验内容] 一.EViews软件的安装: 二.数据的输入与编辑: 三. ...

最新文章

  1. CubieBoard开发板不用ttl线也不用hdmi线的安装方法
  2. 一篇文章带你搞懂前端面试技巧及进阶路线
  3. 超线程_超线程加核显 i310100+梅捷H410超值爆款组合
  4. 科目三场外考试易出错的环节
  5. 动易sitefactory 数据库 mysql msssql_动易SiteFactory配置文件(web.config)常用配置节解读...
  6. 默认权限umask、文件系统权限、特殊权限
  7. jQuery HTML操作
  8. java泛型详解_Java泛型详解(透彻)
  9. 多线程同步工具——volatile变量
  10. php中的条件语句,PHP中的条件语句和示例
  11. cognos java_CognosSDK Java登陆到Cognos
  12. quartz问题记录-missed their scheduled fire-time
  13. SUBMAIL API如何帮助您构建企业云通信平台?
  14. 设计模式总结(Java)
  15. 基于SSM的志愿者管理系统
  16. VC+API模拟键盘按键(详解篇)
  17. javaWeb(b站狂神说)
  18. mac安装ffmpeg遇到的坑
  19. (三)、IText通过pdf模板生成pdf文件(可用做回执单等功能)
  20. windows7英文版变成中文版教程

热门文章

  1. python中int input_两分钟了解python中的input函数
  2. python playsound安装_ python音频库:Windows下pydub安装配置、过程出现的问题及常用API ...
  3. Radeon Vii 系统分析 001记——工具
  4. 无需公司资质的支付平台
  5. win10访问文件共享服务器目录,显示无访问权限时,关于不提示用户名和密码输入的解决办法
  6. python析构函数
  7. 海康工业相机SDK+OpenCV实例(1):海康SDK和OPENCV的安装与编译
  8. 笔记本重装系统后为什么右边键盘不能打字母只能打数字?
  9. html 让文本居中,Html当中文本与标签如何让其居中
  10. 基于FPGA的简易数字时钟