多元回归分析(multiple regression)及其应用
1. 与简单线性回归区别(simple linear regression)
多个自变量(x)
2. 多元回归模型
y=β0+β1x1+β2x2+ … +βpxp+ε
其中:β0,β1,β2… βp是参数
ε是误差值
3. 多元回归方程
E(y)=β0+β1x1+β2x2+ … +βpxp
4. 估计多元回归方程:
y_hat=b0+b1x1+b2x2+ … +bpxp
一个样本被用来计算β0,β1,β2… βp的点估计b0, b1, b2,…, bp
5. 估计流程 (与简单线性回归类似)
6. 估计方法
使sum of squares最小
运算与简单线性回归类似,涉及到线性代数和矩阵代数的运算
7. 例子
一家快递公司送货:X1: 运输里程 X2: 运输次数 Y:总运输时间
目的,求出b0, b1,…. bp:
y_hat=b0+b1x1+b2x2+ … +bpxp
Time = b0+ b1*Miles + b2 * Deliveries
Time = -0.869 + 0.0611 Miles + 0.923 Deliveries
8. 描述参数含义
b0: 平均每多运送一英里,运输时间延长0.0611 小时
b1: 平均每多一次运输,运输时间延长 0.923 小时
9. 预测
如果一个运输任务是跑102英里,运输6次,预计多少小时?
Time = -0.869 +0.0611 102+ 0.923 6= 10.9 (小时)
10. 如果自变量中有分类型变量(categorical data) , 如何处理?
11. 关于误差的分布
误差ε是一个随机变量,均值为0
ε的方差对于所有的自变量来说相等
所有ε的值是独立的
ε满足正态分布,并且通过β0+β1x1+β2x2+ … +βpxp反映y的期望值
# -*- coding:utf-8 -*-
from numpy import genfromtxt
from sklearn import linear_model
# genfromtxt函数
# genfromtxt函数创建数组表格数据
# genfromtxt主要执行两个循环运算。第一个循环将文件的每一行转换成字符串序列。第二个循环将每个字符串序列转换为相应的数据类型。
# genfromtxt能够考虑缺失的数据,但其他更快和更简单的函数像loadtxt不能考虑缺失值。
# 详细用法参考:https://docs.scipy.org/doc/numpy/reference/generated/numpy.genfromtxt.html
# 附加numpy.savetxt该函数能够将数据存储为 CSV 格式:https://docs.scipy.org/doc/numpy/reference/generated/numpy.savetxt.htmldatapath=r"Delivery_Dummy.csv"
data = genfromtxt(datapath,delimiter=",")
#delimiter: the str used to separate data. 横纵坐标以 ',' 分割,因此给 delimiter 传入 ','。delimiter是区分横纵坐标的
# skip_header: the number of lines to skip at the beginning of the file. 这个参数是跳过表头信息的x = data[1:,:-1]
y = data[1:,-1]
print x
print ymlr = linear_model.LinearRegression()mlr.fit(x, y)print mlr
print "coef:"
print mlr.coef_
print "intercept"
print mlr.intercept_xPredict = [90,2,0,0,1]
yPredict = mlr.predict(xPredict)print "predict:"
print yPredict
多元回归分析(multiple regression)及其应用相关推荐
- 机器学习-多元线性回归(Multiple Regression)算法
学习彭亮<深度学习基础介绍:机器学习>课程 与简单线性回归区别 简单线性回归:一个自变量(x) 多元线性回归:多个自变量(x) 多元回归模型 y=β0+β1x1+β2x2+ - +βpxp ...
- python多元线性回归mlr 校正_多元线性回归分析(multiple regression)原理及举例
1. 与简单线性回归区别(simple linear regression) 多个自变量(x) 2. 多元回归模型 y=β0+β1x1+β2x2+ - +βpxp+ε 其中:β0,β1,β2- βp是 ...
- 简单线性回归(Simple Linear Regression)和多元线性回归(Multiple Regression)学习笔记
简单线性回归(Simple Linear Regression) 0.前提介绍: 为什么需要统计量? 统计量:描述数据特征 0.1集中趋势衡量 0.1.1均值(平均数,平均值) (mean):(求和除 ...
- python多元回归分析_多变量分析:多元回归分析
多元回归分析(Multiple Regression Analysis)是多变量分析的基础,也是理解监督类分析方法的入口!实际上大部分学习统计分析和市场研究的人的都会用回归分析,操作也是比较简单的,但 ...
- 一文读懂多元回归分析
一.多元回归分析简介 用回归方程定量地刻画一个应变量与多个自变量间的线性依存关系,称为多元回归分析(multiple linear regression),简称多元回归(multiple regres ...
- 何晓群pdf 应用回归分析第五版_暨南社会学论坛|未成年人司法中的法律实证与统计应用:多元回归分析(第三期)...
12月28日(周一)上午,由美国Sam Houston State University刑事司法学院的Jihong Solomon Zhao教授主讲的"未成年人司法中的法律实证与统计应用:入 ...
- matlab多元回归模型分析,matlab多元回归工具箱 Excel数据分析工具进行多元回归分析.doc...
matlab多元回归工具箱 Excel数据分析工具进行多元回归分析.doc matlab多元回归工具箱 Excel数据分析工具进行多元回归分析 导读:就爱阅读网友为您分享以下"Excel数据 ...
- 使用Excel数据分析工具进行多元回归分析
使用Excel数据分析工具进行多元回归分析与简单的回归估算分析方法基本相同.但是由于有些电脑在安装办公软件时并未加载数据分析工具,所以从加载开始说起(以Excel2010版为例,其余版本都可 ...
- 使用SPSS进行多元回归分析
比用matlab简单. 多元回归分析 在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析.可以建立因变量y与各自变量xj(j=1,2,3,-,n)之间的多元线性回归 ...
最新文章
- es6-Set与Map
- Python 计算机视觉(三)—— 数字图像处理基本操作
- VS2015配置opencv教程(图文详解)
- 百度地图手机和电脑不一致_如何解决电脑显色和印刷色不一致的问题
- 总结 Visual Studio 2019 发布以来 XAML 工具的改进
- 微信支付商业版 结算周期_了解商业周期
- 超值爆赞丨Java 程序员推荐的学习教程,刷爆了朋友圈...
- 【Python】pyinstaller模块将py文件打包为windows可执行文件exe
- IBM将发布以固态硬盘为基础的全企业系统
- apache配置文件httpd.conf部分参数说明
- 苹果叒要开发布会了!多款新机曝光,Intel不淡定了
- python资格认证_Python怎么实现在后端的自定义认证并且实现多条件登陆
- hook代码 svn_Svn结合hook实现自动更新及多Project管理更新
- mybatis-plus代码自动生成器
- 爱心函数可视化 python
- java除去类里面的黄色警告_java中使用list会出现黄色警告图标如何去除
- 淘宝订单、API获取订单
- NEIL: Extracting Visual Knowledge from Web Data
- 仪器规范接地与测量安全
- 几种图像颜色特征空间