预备阅读:【进阶】使用Excel进行相关分析

  前言

  昨天学习了Excel中的相关分析,在数据分析中,相关分析和回归分析关系紧密,今天来学习下Excel中的回归分析。

  回归分析

  回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

  我们在得到两组数据之间的相关程度之后,就可以使用回归分析进行预测了,换言之,相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。但只有当数据之间存在高度相关时,进行回归分析寻求相关的具体形式才有意义。

  回归分析的分类

  在我们的日常数据分析过程中,回归分析是应用十分广泛的一种数据分析方法,该方法主要用于分析单个因变量是如何受到一个或多个自变量影响的。如分析某个产品的销售情况与产品质量、价格、促销活动、天气等因素之间的关系。根据已知的一组数据,我们就可以知道这几个因素对销售额的影响,然后对同类产品的销售额进行预测。

  回归分析的分类如下图1所示:

  

        实例应用:使用多元线性回归分析预测销售额

  1、实例描述

  某品牌汽车经销商的经理了解到投放广告对于汽车销售额增长具有很大的作用,但是他并不明确在电视台投放广告与在各个视频网站投放广告哪种方式对增加汽车销售额更有效。在2017年1月,若在电视台和视频网站分别投入的广告费为20万和30万,那么应估算汽车的销售额为多少万元?针对这种情况,经理手机本公司去年各月的汽车销售额数据及每月在以上两种媒介上投入的广告费用数据,如下图2所示。

  2、实例分析

  简单根据上面的数据,我们并不能确定这两种广告投放渠道哪种更有效,所以,这里我们使用Excel中的回归分析方法,先检验这两组数据与销售额的相关性程度,随后再根据回归分析过程中所得到的线性回归方程预测确定广告费时的销售额。

  3、操作分析

  使用Excel进行多元线性回归分析的因变量是销售额,自变量是两种渠道的广告费,具体步骤如下:

  第1步:选择回归分析工具并设置参数。打开“数据分析”对话框,选择“回归”分析工具,单击“确定”,如图3所示,弹出“回归”对话框,设置“Y值输入区域”为“$D$2:$D$14”,“X值输入区域”为“$B$2:$C$14”;勾选“标志”“置信度”复选框,并设置置信度为“95%”;单击“输出区域”,并设置该区域为“$F$1”;单击确定即可。如图4所示。

  第2步:显示回归分析结果。此时返回工作表,就能得到详细的各项参数值。如图5所示。

  操作解析:

  回归分析的计算结果一共包括三个模块:

  (1)第一个模块为回归统计表,其中主要包含MultipleR、RSquare、AdjustedRSquare、标准误差和观测值。MultipleR为复相关系数,也就是前面说的相关系数,用来衡量x和y之间的相关程度大小,RSquare为复测定系数R2,其用来说明自变量解释因变量变差的程度,从而测量同因变量y的拟合效果,AdjustedRSquare为调整后的复测定系数R2,标准误差衡量拟合程度大小,值越小,说明拟合程度越好,观测值指的是用于估计回归方程数据的观测值个数。

  (2)第二个模块为方差分析表。其主要作用是通过假设检验中的F-检验来判断回归模型的回归效果。

  (3)第三个模块是回归参数表。第一列表示截距,第二列表示对应模型的回归系数,包括了截距和斜率,可以根据这个建立回归模型。第三列为回归系数的标准误差,值越小,表明参数的精确度越高,第四列对应的是统计量t值,用于检验模型参数。第五列为各个回归系数的P值,当P<0.05时,可以认为模型在α=0.05的水平上显著,或置信度达到了95%。最后几列为回归系数置信区间的上限和下限。

  4、决策分析

  上面的结果中可以看到,R值为0.9863,表示广告支出费与销售额之间的关系为高度正相关,复测定系数为0.9727,表明用自变量可解释因变量变差的97.27%,AdjustedRSquare为0.9666,说明自变量能说明因变量的96.66%,因变量剩余的3.33%则由其他因素来解释。

  回归参数表中,回归方程的截距和两个斜率分别为-316.29,9.13,51.06。又因为P值小于0.05,说明了这两个自变量对汽车销售额均有显著影响,但是,两个斜率中,视频网站对应的回归系数更大,说明在视频网站上投放广告更有效。

  由此可得该回归分析的线性回归方程为:y=-316.29+9.13x1+51.06x2。

  预测一下,当电视广告费和视频广告费分别为20万和30万时,汽车销售额的预测值为:y=-316.29+9.13*20+51.06*30=1398.11(万)。

  小结

  上面就是今天的主题内容了,今天学习一下Excel中如何使用相关分析进行预测,这对数据分析很有帮助,可以看到不同渠道投放的广告对我们销售额的影响大小。希望通过上面的操作能帮助大家。如果你有什么好的意见,建议,或者有不同的看法,我都希望你留言和我们进行交流、讨论。

  如果想快速联系我,欢迎关注微信公众号:AiryData。

如需转载,请联系授权,谢谢合作。

【进阶】使用Excel进行回归分析,预测真实值相关推荐

  1. 数据分析系列 9/32 | Excel进行回归分析,预测真实值

    前面学习了Excel中的相关分析,在数据分析中,相关分析和回归分析关系紧密,今天来学习下Excel中的回归分析. PART 01 回归分析 回归分析(regressionanalysis)是确定两种或 ...

  2. TF之AE:AE实现TF自带数据集数字真实值对比AE先encoder后decoder预测数字的精确对比—daidingdaiding

    TF之AE:AE实现TF自带数据集数字真实值对比AE先encoder后decoder预测数字的精确对比-daidingdaiding 目录 输出结果 代码设计 输出结果 代码设计 import ten ...

  3. TF之AE:AE实现TF自带数据集数字真实值对比AE先encoder后decoder预测数字的精确对比

    TF之AE:AE实现TF自带数据集数字真实值对比AE先encoder后decoder预测数字的精确对比 目录 输出结果 代码设计 输出结果 代码设计 import tensorflow as tf i ...

  4. 神经网络真实值和预测值,神经网络算法预测股票

    如何人工神经网络来预测下一个数值 newff函数建立BP神经网络,历史数据作为样本,例如前n个数据作为输入,输入节点为n.当前数据作为p,输出节点为1.隐层节点根据试凑法得到. 通过matlab的tr ...

  5. 时间序列预测任务,预测值相对比真实值趋势滞后问题

    1. 问题描述 我们在采用LSTM,GRU等深度模型进行时间序列预测任务时,通常会采用滑动窗口策略,即将训练集和测试集划分为若干个滑动时间窗口,在每次训练迭代过程中,利用N个历史时间窗口的数据(xt− ...

  6. 预测回归_回归分析预测技术简介

    回归分析的基本概念是用一群变量预测另一个变量的方法.通俗点来讲,就是根据几件事情的相关程度来预测另一件事情发生的概率.回归分析的目的是找到一个联系输入变量和输出变量的最优模型. 回归方法有许多种,可通 ...

  7. 回归分析预测技术介绍

    目录 一. 线性回归 二. Spark MLlib 的 SGD 线性回归算法 三. Spark MLlib 的 SGD 线性回归算法实例 四. 逻辑回归 回归分析的基本概念是用一群变量预测另一个变量的 ...

  8. ML之回归预测:利用十(xgboost,10-1)种机器学习算法对无人驾驶汽车系统参数(2017年的data,18+2)进行回归预测值VS真实值——bug调试记录

    ML之回归预测:利用十(xgboost,10-1)种机器学习算法对无人驾驶汽车系统参数(2017年的data,18+2)进行回归预测值VS真实值--bug调试记录 目录 输出结果 1.增加XGBR算法 ...

  9. 如何用最傻的办法查看tensorflow-yolov3模型测试VOC数据集时预测值(图框)与真实值(图框)的对比效果?

    测试完成后,会打印如下数据 以这段为例: grond truth是标定人员标注的值,你可以把它看作是标准答案:predict result是模型的预测值:0.9095是预测目标为dog的概率:怎么来看 ...

最新文章

  1. Neumorphism.io一个神奇的网站,满足各种圆角矩形ICON图表立体化效果要求,这种样式的名称——新拟态
  2. 冲刺第三天 1.3 THU
  3. 3.2 表达式的类别与类型
  4. (转载)不一样的冒泡排序
  5. Linux服务器各种后门查杀
  6. A1-2017级算法上机第一次练习赛 H 模式寻对
  7. What's the best way to get rid of get parameters from url string?
  8. Guava的Collections2:过滤和转换Java集合
  9. Linux的I2C 设备驱动 -- mini2440 上i2c接口触摸屏驱动
  10. qt项目中的某一个类的输出中文信息乱码,其它类中文输出正常
  11. php post 微信沙箱,微信支付平台错误:获取沙箱密钥失败,确保交易密钥是
  12. 解决Fiddler查看Post参数中文乱码的问题
  13. GoLand 快速入门教程
  14. 页面缓冲滚动到指定位置
  15. 常用计算机名词解释,计算机常用名词解释
  16. docunment对象
  17. 拼音四线三格图片_一年级语文必考拼音拼读+书写规则,孩子开学就会用到!...
  18. 【Linux服务器架设】搭建存储服务器-NFS
  19. 微软软件工程 第一周博客作业
  20. su: Authentication failure问题

热门文章

  1. android 信息-- 发彩信(1)
  2. beyond Compare 4免费破解方法
  3. 川土微 数字隔离器 CA-IS3722HS可替代ADUM1201ARZ
  4. UEFI模式改为BIOS模式
  5. 名帖380 张弼 草书《草书帖选》
  6. [HDU]1205 吃糖果 [抽屉原理]
  7. Python3 将汉语转换为汉语拼音
  8. 高级查询组件dynamicCondition升级为v2.0.0版本(一)——使用步骤
  9. 【板绘软件】板绘初学者入门用什么软件比较好?都有哪些软件呢?
  10. Skyline 3dm格式l数据困惑