不用代码!手把手教你Excel构建数据分析预测模型!
RAM DEWANI | 作者
VK | 编译
https://juejin.im/post/6845166891640553479
你可以在Excel中执行建模,只需几个步骤。
下面是一个教程,介绍如何在Excel中构建线性回归模型以及如何解释结果
Excel真的能构建预测模型?
这通常是我提起这个话题时的第一反应。当我演示如何利用Excel的灵活性为我们的数据科学和分析项目构建预测模型时,接下来是一个令人怀疑的眼神。
让我问你一个问题:如果你周围的商店开始收集客户数据,他们是否可以采用基于数据的策略来销售他们的商品?他们能预测自己的销售额或估计可能销售的产品数量吗?
现在你一定想知道,他们究竟将如何建立一个复杂的统计模型来预测这些事情?学习分析或雇佣分析师可能超出了他们的能力范围。好消息是,他们不需要。
Microsoft Excel为我们提供了一种构建预测模型的能力,而不必编写复杂的代码。
我们可以很容易地在MS Excel中建立一个简单的线性回归模型,它可以帮助我们在几个简单的步骤中执行分析。我们不需要精通Excel或统计学就可以进行预测建模!
在这篇文章中,我将解释如何在Excel中建立一个线性回归模型,以及如何对结果进行分析,以便你成为一名分析师!
1
什么是线性回归?
线性回归是我们大多数人学习的第一种机器学习技术。它也是业界最常用的监督学习技术。
但什么是线性回归?
它是一种线性方法,用于统计建模因变量(要预测的变量)和自变量(用于预测的因素)之间的关系。
线性回归给出了这样一个方程:
Y:因变量
X:自变量
C:系数,基本上是根据重要性分配给特征的权重
最常用的回归方法是OLS(普通最小二乘法)。它的目标是减少平方和以产生这样的最佳拟合线:
2
Excel加载项获取分析工具包
要在Excel中执行回归分析,首先需要启用Excel的分析工具包加载项。Excel中的分析工具包是一个插件程序,为统计和工程分析提供数据分析工具。
要将其添加到工作簿中,请执行以下步骤:
步骤1:Excel选项
转到文件->选项:
步骤2:定位分析工具包
转到左侧面板上的加载项->管理Excel加载项->转到:
第3步:添加分析工具包
选择“分析工具包”并按“确定”:
你已在Excel中成功添加分析工具包!你可以通过转到功能区中的数据栏进行检查。
让我们开始用Excel建立我们的预测模型!
3
在Excel中实现线性回归
到目前为止,很多东西都是理论上的。现在,让我们深入了解Excel并进行线性回归分析!
下面是我们将要处理的问题声明:
Winden镇有一家卖鞋的公司。该公司希望通过考虑以下因素来预测每个客户的销售情况:客户收入、离家距离、客户每周的跑步频率。
步骤1:选择回归
进入数据->数据分析
转到数据工具包中的“数据分析”,选择“回归”,然后按“确定”:
步骤2:选择
在这一步中,我们将选择一些分析所需的选项,例如:
1.输入y范围–独立因子的范围
2.输入x范围-相关因素的范围
3.输出范围–要显示结果的单元格范围
其他选项是自由选择的,你可以根据你的特定目的选择它们。
按OK,我们最终在Excel中用两个步骤进行了回归分析!很简单!现在我们将在excel中看到回归分析的结果。
4
用Excel分析预测模型的结果
实施线性回归模型是最简单的部分。现在是我们分析的棘手方面——在Excel中解释预测模型的结果。
综上所述,我们有三种产出类型,我们将逐一介绍:
回归统计表
方差分析表
回归系数表
残差表
1.回归统计表
回归统计表告诉我们最佳拟合线如何定义自变量和因变量之间的线性关系。两个最重要的度量是R方和调整R方。
R方统计量是拟合优度的指标,它告诉我们最佳拟合线解释了多少方差。R方的范围从0到1。
在我们的例子中,R平方值为0.953,这意味着我们的行能够解释95%的方差——这是一个好的迹象。
但是有一个问题-当我们不断增加更多的变量,我们的R平方值将继续增加,即使变量可能没有任何影响。调整R平方解决了这个问题,是一个更可靠的度量。
2.方差分析表
方差分析表将平方和分解为其组成部分,以提供模型内变化的详细信息。
它包括一个非常重要的指标,显著性F(或P值),它告诉我们你的模型是否具有统计显著性。
简而言之,这意味着我们的结果可能不是由于随机性,而是因为一个潜在的原因。
p值最常用的阈值是0.05。如果我们得到的值低于这个,就可以了。否则,我们需要选择另一组自变量。
在我们的例子中,我们的值远低于0.05的阈值。太棒了,我们现在可以前进了!
3.回归系数表
系数表以系数的形式分解回归线的组成部分。从中我们可以了解很多。
对于Winden鞋业公司来说,似乎每增加一个单位的收入,销售额就增加0.08,而增加一个单位的店面距离就增加508个销售额!
running frequency的增加似乎使销售量减少了24,但我们真的能相信这个特征吗?
如果你看上面的图片,你会发现它的p值大于0.5,这意味着它在统计学上不显著。
4.残差表
残差表反映了预测值与实际值之间的差异。
它由我们的模型预测的值组成:
5
如何改进我们的模型?
如前所述,变量running frequency的p值大于0.05,因此让我们从分析中移除该变量来检查结果。
我们将遵循上述所有步骤,但不包括running frequency列:
我们注意到调整后的R平方的值从0.920略微提高到0.929!
6
用Excel做预测!
我们已经准备好回归分析了,现在该怎么办?让我们看看。
你的一位老顾客,名叫亚历山德,走进来,我们想预测他的销售额。我们可以简单地从线性回归模型的数据中插入数字。
Aleksander有4万的收入,住在离商店2公里的地方。估计销售额是多少?
方程变成:
在这里,我们的模型估计,亚历山德先生将支付4218购买他的新鞋!这就是简单地在Microsoft Excel中进行线性回归的能力。
7
结尾
在本文中,我们学习了如何在Excel中建立线性回归模型以及如何解释结果。我希望这本教程能帮助你成为一个更好的分析师或数据科学家。
- END -
本文为转载分享&推荐阅读,若侵权请联系后台删除
●《 打工人分析简报 》
●取数,取数,取个屁啊!
后台回复“入群”即可加入小z数据干货交流群
不用代码!手把手教你Excel构建数据分析预测模型!相关推荐
- 《从零构建前后分离的web项目》:前端完善 - 手把手教你快速构建网站布局
添砖加瓦 - 手把手教你快速构建网站布局 项目地址 本章源码地址 文章地址 本文为方便讲述重构去除了 Element.vux 库,用了最近比较火的 bulma 轻量.快捷.易读. 项目截屏 Layou ...
- 手把手教做Excel直方图
手把手教做Excel直方图 2017-10-05 作者:ExcelHome 阅读:71968次 直方图是用于展示数据的分组分布状态的一种图形,用矩形的宽度和高度表示频数分布,通过直方图,用户可以很 ...
- 手把手教大家快速构建自动回复机器人
手把手教大家快速构建自动回复机器人 聊天机器人可以说在我们生活中的应用非常普遍了. 它们依托于互联网资源,回答用户的日常问题,或者主动提醒和推荐.比如,苹果的Siri,微软的Cortana这种的语音机 ...
- 干货 :手把手教你Tableau高级数据分析功能(附数据集)
原文标题:A Step-by-Step Guide to learn Advanced Tableau – for Data Science and Business Intelligence Pro ...
- clion浏览linux代码,手把手教你使用 Clion 开发 Linux C++ 项目
手把手教你使用 Clion 开发 Linux C++ 项目 关于CLion CLion是一款专为开发C及C++所设计的跨平台IDE.它是以IntelliJ为基础设计的,包含了许多智能功能来提高开发人员 ...
- python简单代码-手把手教你用Python创建简单的神经网络(附代码)
了解神经网络工作方式的***途径莫过于亲自创建一个神经网络,本文将演示如何做到这一点. 神经网络(NN)又称人工神经网络(ANN),是机器学习领域中基于生物神经网络概念的学习算法的一个子集. 拥有五年 ...
- 手把手教你快速构建一份全国疫情分布地图
本文基于百度地图API和fangkai提供的疫情数据API制作,是一份真实并实时的疫情场所分布地图,演示地址:https://rovertang.com/map/ncov/ 花絮 上次发表了如何制作一 ...
- 手把手教你学PowerBI数据分析:制作客户分析报告
客户分析就是根据客户信息数据来分析客户特征,评估客户价值,从而为客户制订相应的营销策略与资源配置.通过合理.系统的客户分析,企业可以知道不同的客户有着什么样的需求,分析客户消费特征与商务效益的关系,使 ...
- 手把手教你调试构建一个Vue/小程序商城项目源码
下面将详细的介绍weiphp5.0商城项目的调试打包上线的流程: 安装NodeJs/NPM 安装CNPM(可忽略) 运行项目 打包上线项目 1. 安装NodeJs 推荐到NodeJS的官网下载安装包 ...
最新文章
- 以下不是python文件读写方法的是-Python 文件I/O
- mysql修改表引擎Engine
- 访问Mat中每个像素的值
- 1.2 Name That Number
- 天天象棋 残局闯关 第2关
- nacos配置中心使用_SpringBoot开发案例Nacos配置管理中心
- python的json模块
- 【python简洁之道】-----2.导入模块顺序(规范/风格)
- php发送sql,php学习笔记(二)php与mysql连接与用php发送SQL查询
- java 强制声明为引用_JAVASERIPT高级程序设计35~45页
- 树莓派 | Debian更改屏幕分辨率 或 解决树莓派使用HDMI-VGA转换器黑屏的方案
- c语言输出字母空心菱形,C语言实现打印菱形和空心菱形
- 正则表达式验证ip是否是内网ip
- 设计模式学习——代理模式(proxy)
- python练习-华氏转摄氏
- [java] POI shiftRows 移动后合并的单元格被拆分了
- 曼哈顿距离,欧式距离,余弦距离
- Win11会触发部分游戏反作弊致使误封
- [算法深究]奇葩排序
- iso镜像添加软件包_Linux系统自定义制作ISO安装镜像