回归分析是一种统计分析方法,用于研究多个统计量之间的关系,并利用关系进行预测。线性回归模型是最简单的回归分析模型,下面我们应用线性回归来预测票房。

图8-5是计算机模拟生成的500个数据点,每个点表示一部电影,横坐标是预告片搜索量,纵坐标是票房。图8-5称为散点图,是统计分析中最简单、最常用的图,用于对数据的规律做初步观察。观察图8-5可以发现,这些数据点大多分布在一条直线附近,这条直线代表了这些数据的分布规律,线性回归要做的就是根据散点图找到这条直线,这一过程也称为线性拟合。

图8-5 首周票房和预告片搜索量的散点图

设拟合直线的方程是y=ax+b,x表示预告片搜索量,y表示首周票房。线性回归的目标是找到最能体现数据特征的直线,也就是说,这条直线需要尽可能地“接近”所有数据。衡量多个点和一条直线之间的“接近程度”,最常用的指标是误差平方和。图8-6是误差平方和的一个示意图,基础数据包含4个点(图中的空心圆圈),这四个点的X坐标分别对应拟合直线上的四个Y坐标,图中四条虚线的长度的平方和就是误差平方和,使误差平方和最小的那条直线就是最佳拟合直线,这种求解方法也称为最小二乘回归法。

图8-6 误差平方和示意图

当误差平方和达到最小值时,可以计算出a和b的值为

至此便计算出了最佳拟合直线的表达式。

在处理线性回归问题时,我们可以把数据代入公式中进行计算,也可以使用统计软件,如Excel、R、SPSS等常用统计软件都有线性回归函数,我们只需要做少量的操作或编码就可以计算出线性回归的结果。

经计算,票房和搜索量的线性回归直线方程是:

y=3.5x+13.6

这条直线代表了票房和搜索量之间的关系,如图8-7所示。我们可以使用这条直线来预测票房,比如,某部即将上映的影片,预告片搜索量是12万次,即x=12,根据直线方程可以计算出y=55.6,因此我们预测这部影片的首周票房是55.6万美元。

图8-7 线性回归结果

除了直线方程,我们还可以计算另一个量化指标——相关系数。相关系数可以帮助我们判断两个变量的线性相关关系。此前,我们观察散点图,已经发现票房和搜索量之间近似存在线性相关关系,这只是感性判断,相关系数是对线性相关关系的理性判断。

相关系数r的计算公式为

r=a×Sx/Sy

式中,a是直线方程中的a,Sx表示X的标准差,Sy表示Y的标准差。如图8-8所示,r可以是-1~1的任意数值,其中最特别的三个数值是-1、1和0,含义如下:

r=-1表示y和x存在负相关关系,即a是负数;

r=1表示y和x存在正相关关系,即a是正数;

r=0表示y和x不存在任何线性相关关系,即a=0,不存在拟合直线。

图8-8 线性相关系数r的示意图

在实际问题中,r的值大多不会是-1、1或0,但我们可以借助它们的含义来判断线性相关关系。比如,当r=0.9时,我们认为r的值接近1,y和x存在近似的正相关关系;当r=-0.9时,我们认为r的值接近-1,y和x存在近似的负相关关系;当r=0.05时,我们认为r的值接近0,y和x几乎不存在线性相关关系。

至此,我们计算出了线性回归方程和线性相关系数。

线性回归相关系数c语言,线性回归方程和线性相关系数计算实例相关推荐

  1. c语言一元线性回归方程程序,C语言编程对实验数据进行一元线性回归处理

    1997年第3期 云南化工 55 计算机应用 C语言编程对实验数据进行一元线性回归处理 杨继红 尹家元 沈 勇 (云南大学化学系 昆明650091) 摘 要 用目前最有发展前景的C语言编程处理分析实验 ...

  2. R语言与多元线性回归方程及各种检验

    R语言与多元线性回归方程及各种检验 文章目录 R语言与多元线性回归方程及各种检验 一.模型建立 二.多重共线性 (1)产生的背景: (2)多重共线性的检验 1.简单相关系数法: 2.方差膨胀因子(vi ...

  3. 线性回归_线性回归方程

    你的线性回归是指被估参数是线性的回归吗?被估参数是线性是指:把参数视为变量,参数相对于x是线性的.比如:y=kx+b这是典型的线性回归还有:y=ax^2+bx+c,把x^2及x看成a,b的系数的话,a ...

  4. 一元线性回归方程C语言实现

    之前没写对,尴尬,于是重新研究了一遍,啊,确实没写对·····大佬帮改了一下····· 首先来看看如何求线性回归方程公式http://www.gaosan.com/gaokao/263926.html ...

  5. R语言第七讲 线性回归分析案例

    题目 MASS 库中包含 Boston (波士顿房价)数据集,它记录了波士顿周围 506 个街区的 medv (房价中位数).我们将设法用 13 个预测变量如 rm (每栋住宅的平均房间数), age ...

  6. 最小二乘法构建线性回归方程

    目录 一. 相关数学知识的定义 1.1 一元线性回归的定义 1.2 相关系数R²的定义 二.使用jupyter来做一元线性回归分析 2.1 根据最小二乘法公式手动构建一元线性回归模型 2.2 调用包实 ...

  7. 基于jupyter notebook的python编程-----利用梯度下降算法求解多元线性回归方程,并与最小二乘法求解进行精度对比

    基于jupyter notebook的python编程-----利用梯度下降算法求解多元线性回归方程,并与最小二乘法求解进行精度对比目录 一.梯度下降算法的基本原理 1.梯度下降算法的基本原理 二.题 ...

  8. 多元线性回归matlab代码_医学统计|多元线性回归分析

    回归分析的定义:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法.运用十分广泛.其表达形式为y = w'x+e,e为误差服从均值为0的正态分布.回归分析中,只包括一个自变量和一个 ...

  9. 用Excel求线性回归方程

    文章目录 一.何为线性回归 二.如何制作线性回归 最小二乘法 三.利用Excel求线性回归方程 操作方法 1.选择需要拟合的数据 2.点击工具栏的插入,选择插入散点图 3.在生成的表格右上角勾选上生成 ...

  10. 多元线性回归方程原理及其推导

    多元线性方程原理及推导 概念 1.在统计学中,线性回归方程是利用最小二乘函数对一个或多个自变量之间关系进行建模的一种回归分析.这种函数是一个或多个称为回归系数的模型参数的线性组合.只有一个自变量的情况 ...

最新文章

  1. convert-----Linux中的图片处理工具
  2. float、double(浮点数)区别还有和decimal(定点数)的比较
  3. 请简述php循环控制语句,PHP 循环控制语句几种方法详解_PHP教程
  4. windows改变php版本
  5. eclipse @ 注释为何一写就报错
  6. 测试综合技能的期末预测
  7. python3之协程(3)---greenlet实现协程操作
  8. [图像处理] 直方图均衡化原理 - 数学推导
  9. 关注:Eclipse,转贴eclipse CDT的开发文章
  10. qq文件对方接收后一定会有提示吗_为什么微信、QQ不推出已读功能?因为它敢出网友就敢卸载...
  11. 【Pytorch神经网络实战案例】09 使用卷积提取图片的轮廓信息(手动模拟Sobel算子)
  12. SpringAs3的一些配置参数
  13. Atitit 常见硬件集成列表 目录 1.1. 小程序设备类 1 1.2. atitit.常见手机的传感器与外设 attilax总结 1 1.3. Pc机外设 1 1.4. 设备管理器 2 1.1
  14. ../bin/testCurveFitting 出现的错误以及解决办法
  15. 手机QQ空间装逼代码收集
  16. selenium--自动化识别图片验证码并输入
  17. c#中PROCESS的用法
  18. kws 命令词唤醒介绍
  19. 此 Google 帐号尚未与设备关联。要安装应用,请先访问设备上的 Play 商店应用。 了解详情
  20. 计算机网络:路由的概念及其分类

热门文章

  1. android ppt 转图片显示不全,ppt转pdf图片显示不全怎么办 这两种方法供您参考
  2. 期末排名算不算计算机成绩,智学网怎么看年级排名 智学网如何查看期末考试成绩...
  3. 美图秀秀一寸照片的制作
  4. 第五人格显示服务器连接失败,第五人格网络连接失败怎么回事
  5. tx2 安装 Anaconda
  6. 【英语:基础进阶_原著扩展阅读】J1.英文原著的选择和有效阅读方法
  7. 漫谈数据仓库中的元数据管理
  8. 【error】error: failed to push some refs to ‘远程仓库地址‘ git报错解决
  9. 服务器被入侵了怎么办
  10. 桌面文件不见了怎么恢复?整理的这3个方法你一定不能错过