给大家安利一款朋友开发的自研国产数据分析基础工具,一键式自动分析,自动生成分析模板,5分钟掌握主流61个统计类数学模型(几乎涵盖SPSS绝大部分功能),以及23个有监督机器学习(包括随机森林,SVM,XGBoost等)

PS:巨方便简单上手,貌似现在是免费

官网:www.mpaidata.com   mpai数据科学平台

1 基本知识介绍

1.1回归模型的引入

由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型。所以在遇到有些无法用机理分析建立数学模型的时候,通常采取搜集大量数据的办法,基于对数据的统计分析去建立模型,其中用途最为广泛的一类随即模型就是统计回归模型。

回归模型确定的变量之间是相关关系,在大量的观察下,会表现出一定的规律性,可以借助函数关系式来表达,这种函数就称为回归函数或回归方程。

1.2回归模型的分类

2 用回归模型解题的步骤

回归模型解题步骤主要包括两部分,一:确定回归模型属于那种基本类型,然后通过计算得到回归方程的表达式;二:是对回归模型进行显著性检验。

一:①根据试验数据画出散点图;

②确定经验公式的函数类型;

③通过最小二乘法得到正规方程组;

④求解方程组,得到回归方程的表达式。

二:①相关系数检验,检验线性相关程度的大小;

②F检验法(这两种检验方法可以任意选);

③残差分析;

④对于多元回归分析还要进行因素的主次排序;

如果检验结果表示此模型的显著性很差,那么应当另选回归模型了。

3模型的转化

非线性的回归模型可以通过线性变换转变为线性的方程来进行求解:例如

函数关系式:可以通过线性变换:转化为一元线性方程组来求解,对于多元的也可以进行类似的转换。

4举例

例1(多元线性回归模型):已知某湖八年来湖水中COD浓度实测值(y)与影响因素湖区工业产值(x1)、总人口数(x2)、捕鱼量(x3)、降水量(x4)资料,建立污染物y的水质分析模型。

(1)输入数据

x1=[1.376, 1.375, 1.387, 1.401, 1.412, 1.428, 1.445, 1.477]

x2=[0.450, 0.475, 0.485, 0.500, 0.535, 0.545, 0.550, 0.575]

x3=[2.170 ,2.554, 2.676, 2.713, 2.823, 3.088, 3.122, 3.262]

x4=[0.8922, 1.1610 ,0.5346, 0.9589, 1.0239, 1.0499, 1.1065, 1.1387]

y=[5.19, 5.30, 5.60,5.82,6.00, 6.06,6.45, 6.95]

(2)保存数据(以数据文件.mat形式保存,便于以后调用)

save  data x1 x2 x3 x4 y

load data  (取出数据)

(3)执行回归命令

    

[b,bint,r,rint,stats] = regress(y,x)

得结果:

b = (-16.5283,15.7206,2.0327,-0.2106,-0.1991)’

stats = (0.9908,80.9530,0.0022)

即:= -16.5283 + 15.7206xl + 2.0327x2 – 0.2106x3 + 0.1991x4

= 0.9908,F = 80.9530,P = 0.0022

通过查表可知,代表决定系数(R代表相关系数),它的值很接近与1,说明此方程是高度线性相关的;

F检验值为80.9530远大于,可见,检验结果是显著的。

例2(非线性回归模型)非线性回归模型可由命令nlinfit来实现,调用格式为

[beta,r,j] = nlinfit(x,y,'model’,beta0)

其中,输人数据x,y分别为n×m矩阵和n维列向量,对一元非线性回归,x为n维列向量model是事先用 m-文件定义的非线性函数,beta0是回归系数的初值, beta是估计出的回归系数,r是残差,j是Jacobian矩阵,它们是估计预测误差需要的数据。

预测和预测误差估计用命令

[y,delta] = nlpredci(’model’,x,beta,r,j)

如:对实例1中COD浓度实测值(y),建立时序预测模型,这里选用logistic模型。即

(1)对所要拟合的非线性模型建立的m-文件mode1.m如下:

function yhat=model(beta,t)

yhat=beta(1)./(1+beta(2)*exp(-beta(3)*t))

(2)输人数据

t=1:8

load data y(在data.mat中取出数据y)

beta0=[50,10,1]’

(3)求回归系数

[beta,r,j]=nlinfit(t’,y’,’model’,beta0)

得结果:

beta=(56.1157,10.4006,0.0445)’

(4)预测及作图

[yy,delta] = nlprodei(’model’,t’,beta,r,j);

plot(t,y,’k+’,t,yy,’r’)

3.逐步回归

逐步回归的命令是stepwise,它提供了一个交互式画面,通过此工具可以自由地选择变量,进行统计分析。调用格式为:

stepwise(x,y,inmodel,alpha)

其中x是自变量数据,y是因变量数据,分别为n×m和n×l矩阵,inmodel是矩阵的列数指标(缺省时为全部自变量),alpha,为显著性水平(缺省时为0.5)

结果产生三个图形窗口,在stepwise plot窗口,虚线表示该变量的拟合系数与0无显著差异,实线表示有显著差异,红色线表示从模型中移去的变量;绿色线表明存在模型中的变量,点击一条会改变其状态。在stepwise Table窗口中列出一个统计表,包括回归系数及其置信区间,以及模型的统计量剩余标准差(RMSE),相关系数 (R-square),F值和P值。

例3、主成份分析

主成份分析主要求解特征值和特征向量,使用命令 eig(),调用格式为

[V,D] = eig(R)

其中R为X的相关系数矩阵,D为R的特征值矩阵,V为特征向量矩阵

实例3:对实例1中变量进行主成份成析

(1)调用数据

load data

x =

(2)计算相关系数矩阵

R = corrcoef(x)

(3)求特征根、特征向量

[V,D] = eig(R)

得结果:

按特征根由大到小写出各主成份

第一主成份

f1 = 0.5438xl+0.5505x2+0.5387x3+0.3332x4

方差贡献率为3.1863/4 = 79.66%

第二主成份

f2 = -0.1693xl-0.1588x2 –0.2484x3 +0.9404x4

方差贡献率为0.7606/4 = 19.12%

第三主成份

f3 = -0.7597x1 + 0.0930x2 + 0.6418x3 + 0.0485x4

方差贡献率为0.0601/4=1.5%

数学建模常用模型05 :多元回归模型相关推荐

  1. 数学建模常用模型04:灰色关联分析法

    数学建模常用模型04:灰色关联分析法 灰色关联分析法 本文所用的资料参考来源:美赛资料网:美赛资料网 与灰色预测模型一样,比赛不能优先使用,灰色关联往往可以与层次分析结合使用.层次分析用在确定权重上面 ...

  2. 数学建模常用模型(一):灰色预测法

    数学建模常用模型(一):灰色预测法 灰色预测法是一种用于处理少量数据.数据质量较差或者缺乏历史数据的预测方法.它适用于一些非线性.非平稳的系统,尤其在短期预测和趋势分析方面有着广泛的应用.灰色预测法作 ...

  3. 数学建模——智能优化之模拟退火模型详解Python代码

    数学建模--智能优化之模拟退火模型详解Python代码 #本功能实现最小值的求解#from matplotlib import pyplot as plt import numpy as np imp ...

  4. 数学建模_随机森林分类模型详解Python代码

    数学建模_随机森林分类模型详解Python代码 随机森林需要调整的参数有: (1) 决策树的个数 (2) 特征属性的个数 (3) 递归次数(即决策树的深度)''' from numpy import ...

  5. Algorithm:数学建模大赛(CUMCM/NPMCM)之数学建模(经验/技巧)、流程(模型准备/模型假设/建模/求解/分析/优化/预测/评价)、论文写作(意义/摘要/关键词/问题重述和模型假设/建

    Algorithm:数学建模大赛(CUMCM/NPMCM)之数学建模(经验/技巧).流程(模型准备/模型假设/建模/求解/分析/优化/预测/评价).论文写作(意义/摘要/关键词/问题重述和模型假设/建 ...

  6. 数学建模常用读取excel和txt代码

    文章目录 一.matlab篇 1.1.读取.xls和.xlsx的数据 1.2.读取.csv的数据 二.python篇 2.1.pandas库 2.1.1.xlsx和xls的读取和写入 2.1.2.cs ...

  7. 【Python数学建模常用算法代码(二)之BP神经网络】

    Python数学建模常用算法代码(二) BP神经网络模型Python代码 import numpy as np import math import random import string impo ...

  8. 二维动态规划降维误差一般为多少_数学建模常用算法模型

    数学模型的分类 按模型的数学方法分: 几何模型.图论模型.微分方程模型.概率模型.最优控制模型.规划论模型.马氏链模型等 按模型的特征分: 静态模型和动态模型,确定性模型和随机模型,离散模型和连续性模 ...

  9. 【数学建模常用模型】图论专题

    图论是研究点.线间关系的一门学科.现实生活中,凡是涉及到事物间的关系,都可以抽象为图论模型.图论模型也是各大数学建模中常见的一种模型,主要用于计算.规划最短距离.路线等问题.下面介绍几个基本概念和算法 ...

最新文章

  1. Error: Aesthetics must be either length 1 or the same as the data (5): fill
  2. Oracle迁移数据库
  3. C语言找出4个最大和4个最小数,济南大学C语言程序设计教案:C语言实验课程第四课.doc...
  4. oracle 11.2.4联机文档,ORACLE 11G 联机文档partition_extended_name的一个错误
  5. android 人脸识别边框_android Arcface人脸识别框/人脸抓拍框/人脸追踪框
  6. 视觉SLAM笔记(12) 四元数
  7. php算法结构,PHP中常用算法以及数据结构
  8. python2.7 安装第三方库
  9. 创新驱动 | 悬镜安全持续入选《CCSIP 2021中国网络安全产业全景图》
  10. FreeMarker下拉列表选中值回显
  11. spss25 等待服务器响应出现问题,spss打开配置服务器失败
  12. flash, sparkle, glow, gleam, twinkle, glitter
  13. C语言小熊时钟实验报告,用VC6.0编写一个小熊时钟(求代码)
  14. Airbnb如何应用AARRR策略成为全球第一民宿平台
  15. php pdf数字签名,用PHP从PDF中检索数字签名信息
  16. 预测模型之灰色系统预测
  17. 改进duilib的richedit控件的部分功能
  18. Revit二次开发:修改视图范围
  19. python webdriver.Chrome chromedriver驱动下载
  20. 计算机考研大纲代码,2017考研大纲:计算机考研大纲文字版之计算机组成原理...

热门文章

  1. data mining (foreign blogs)
  2. [4G5G专题-109]:部署 - LTE RF射频优化的流程、原因综合分析、解决办法大全
  3. 用python画一颗樱花树
  4. Win10 笔记本 解决屏幕忽明忽暗,自动降低亮度问题
  5. linux下rpm包安装MySQL
  6. ST表 详解(C语言描述)
  7. 怎么制作公司网页教程【网站制作】
  8. usb网卡转接口被识别为光盘
  9. qgg包-续2-大数据集教程
  10. u深度做linux启动盘,u深度启动盘制作