线性回归分析实例(餐饮数据)python皮尔逊相关性
前言
线性回归:在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。
皮尔逊相关系数:在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPMCC或PCCs),是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。
实例
在一次实例分析中,需要收集多个特征因素,通过皮尔逊相关系数,剔除相关性较差的因素后,进行建模;
date:日期 time:星期几 tem:历史温度 y:营业额 tc:总单数 viptc:会员单数
先导一波库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import LinearRegression
绘制散点图,并观察相关性
data_df=pd.read_csv(a)
print(data_df.head())
sns.pairplot(data_df,size=1)
plt.show()
seaborn计算绘制皮尔逊相关性系数并汇图
cols=['date','time','tem','tc','viptc','y']
cm =np.corrcoef(data_df[cols].values.T)
hm = sns.heatmap(cm,cbar=True,annot=True,square=True,fmt=".2f",annot_kws={"size":15},yticklabels=cols,xticklabels=cols)
plt.show()
可以看出,营业额和温度的相关性较差,也因为是在同一个月的数据,温度变化并不大;
利用sklearn建模,并用模型预测出营业额
cols2=[['date','time','tc','viptc','y']]
mo=LinearRegression()
x=data_df[['date','time','tc','viptc']]
y=data_df['y']#实际营业额
mo.fit(x,y)
pre_y=mo.predict(x)#预测营业额
结论
特征因素一般要选择能收集的因素,才方便对未来的预测,在本个例子里,TC本来就是发生后才能知道的特征,是不应该作为特征因素来建模的,我只是正好收集了这些数据,所以才这样用,在实际工作中,应该以例如,地铁口到餐厅的距离,周围人群分部,一定范围内写字楼和住宅数量,区域人均收入,等等因素来做预测更为实用;
另外,虽然模型很容易建立起来,但学习者还是需要把模型原理搞清楚,例如回归的原理,最小二乘法等等数学知识搞清楚,才能建出更理想的模型;
线性回归分析实例(餐饮数据)python皮尔逊相关性相关推荐
- [Python] 一元线性回归分析实例
本文通过一个简单的例子:预测房价,来探讨怎么用python做一元线性回归分析. 1. 预测房价 房价是一个很火的话题,现在我们拿到一组数据,是房子的大小(平方英尺)和房价(美元)之间的对应关系,如下( ...
- python:一元线性回归分析实例:时间序列分段
一元线性回归分析实例:时间序列分段 以沪深300指数基金净值为例 基金净值数据格式:date,jz,ljjz 2019-01-02,1.0194,1.0194 2019-01-03,1.0177,1. ...
- python:一元线性回归分析实例: 基金净值
一元线性回归分析实例: 以沪深300指数基金净值为例 基金净值数据格式: date,jz,ljjz 2019-01-02,1.0194,1.0194 2019-01-03,1.0177,1.0177 ...
- python对于一元线性回归模型_Python一元线性回归分析实例:价格与需求的相关性...
来自烟水暖的学习笔记 回归分析(Regression analysis) 回归分析(Regression analysis),是研究因变量与自变量之间相关性的一种数学方法,并将相关性量化,即得到回归方 ...
- excel多元线性拟合_Python一元线性回归分析实例:价格与需求的相关性
来自烟水暖的学习笔记 回归分析(Regression analysis) 回归分析(Regression analysis),是研究因变量与自变量之间相关性的一种数学方法,并将相关性量化,即得到回归方 ...
- 基于Python和R的多元线性回归分析实例
文章目录 实验目的 实验内容 分析影响因变量Y的主要影响因素及经济意义 建立散点图考察Y与每一个自变量之间的相关关系 Python R语言 建立多元回归模型,并计算回归系数和统计量 Python R语 ...
- python线性回归实例_Python机器学习线性回归分析实例 | kTWO-个人博客
前言 在前面的文章中,我们都是简单的对线性回归模型进行构建,这篇文章我们采用网上下载的数据量比较大的数据来对模型进行构造,最后讲述在线性的情况下如何对模型进行评估. 数据集介绍 下图是该数据集的前10 ...
- R语言 线性回归分析实例
y,X1,X2,X3 分别表示第 t 年各项税收收入(亿元),某国生产总值GDP(亿元),财政支出(亿元)和商品零售价格指数(%). (1) 建立线性模型: ① 自己编写函数: > librar ...
- python多元线性回归实例_关于多元线性回归分析——PythonSPSS
原始数据在这里 1.观察数据 首先,用Pandas打开数据,并进行观察. import numpy import pandas as pd import matplotlib.pyplot as pl ...
最新文章
- javascript之基本概念
- .NET 生态系统的蜕变之 .NET 6
- 在Ubuntu8.04上简单定制个性化的Terminal操作界面
- itext-2.1.7.jar
- verilog学习记(测试和验证)
- rls自适应滤波器matlab实现,rls算法的自适应滤波器matlab仿真作业.doc
- 三大特征 六大原则结合实践运用
- Unity背包系统 设计流程
- IntelliJ Idea设置护眼浅绿色背景方法
- .NET6东西--可写的JSON DOM API
- 【STM32】几款常用产品(F1、F4、F7)的区别
- AutoCAD .NET 二次开发实例:批量文本查找替换
- 计算机技术基础概念,2017年计算机三级网络技术基本概念与名词解释:计算机基础知识部分...
- Android TextView跑马灯不动 及属性
- 【软件测试-实验-7】使用LR进行性能测试
- ET200SP CAD授人以渔
- 如何理解host,Host是什么意思
- RK3399参考设计方案之DC-DC电源芯片RK808D【转】
- Python连接mysql,sql优化
- [XJTUSE]数据结构学习——第一章 线性表 1.3 单链表的实现(JAVA)