一、线性回归
1.定义
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。
回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
2.操作
(1)准备数据

本文介绍的是简单的一元线性回归。准备好数据之后,一定要分清楚自变量和因变量。样本数据中很明显销售量属于自变量,而销售额属于因变量。
(2)绘制散点图

绘制散点图的目的是先大致观察一下这两个变量之间是否存在线性相关性,正相关还是负相关。很明显,销售量和销售额具有线性正相关性。
(3)预测结果
当老板问你:“小样儿,如果这个月的销售量是80,根据以往经验看,销售额能达到多少啊?”

FORECAST——这个函数可以用于通过一条线性回归拟合线返回一个预测值。
语法如下:
第一个参数为预测值,第二个参数为因变量的值,第三个参数为自变量的值。

二、相关系数
1.定义
相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
在实际工作过程中,主要研究两个对象之间是否具有线性相关性,以及相关程度有很大。比如,购买奶粉的顾客是否也会购买尿不湿,这两者之间的关联度有多大?就可以计算出两者的相关系数大小从而得出结论。
2.操作
(1)准备数据

(2)绘制散点图

**注意:配图有点问题,应该为散点图!!主要是数据是编的,大家理解原理即可!**绘制散点图的目的是初步定性的分析一下,两者是否具有相关性。
(3)相关系数

CORREL——这个函数可以用来返回两组数值的相关系数。
语法如下:
第一个参数为计算相关系数的对象1的值,第二个参数为计算相关系数的对象2的值。
结果显示,两者的相关系数为0.648,可以认定两者存在相关性(r>0.6),一般大于0.6可认为两者属于强相关。进一步说明,买奶粉的顾客中买尿不湿的顾客也很多(反过来也可以解释),可以指导实际零售商进行商品的摆放等操作。

严小样儿教你做数据分析(1)——Excel做一元线性回归预测和相关系数计算相关推荐

  1. 程序员必修课:为什么非要用Python做数据分析?Excel不好吗?

    日本最大的证券公司之一野村证券首席数字官马修·汉普森,在Quant Conference上发表讲话:"用Excel的人越来越少,大家都在码Python代码." 甚至直接说:&quo ...

  2. 程序员必修课:为什么非要用 Python 做数据分析?Excel 不好吗?

    伴随着移动互联网的飞速发展,越来越多用户被互联网连接在一起,用户所积累下来的数据越来越多,市场对数据方面人才的需求也越来越大,由此也带火了如数据分析.数据挖掘.算法等职业. 数据分析师就业待遇和发展前 ...

  3. 程序员的基本功:为什么非要用 Python 做数据分析?Excel 不好吗?

    Python能够这么火其中一个重要的原因是数据分析带起来的.Python的优点有很多,要是能运用到工作中,会发现工作的效率大大提升,当然涨薪也是再正常不过的事情. 互联网公司很多人都喜欢用Python ...

  4. #Python小技巧#教你用Python在Excel里画画

    之前看到过很多头条,说哪国某人坚持了多少年自学使用 excel 画画,效果十分惊艳. 对于他们的耐心我十分敬佩. 但是作为一个程序员,自然也得挑战一下自己. 这种需求,我们十分钟就可以完成! imag ...

  5. 如何使用计算机制作表格,怎么在电脑上制作表格? 教你使用word和Excel做表格

    表格是我们平常办公的时候非常常见的文档数据,表格工具也给我们提供了非常强大的功能,提高了我们办公的效率.不过在计算机中,表格的编辑也是非常多种多样的,除了Excel外,word等一些办公软件也能够编辑 ...

  6. 转行做数据分析的心路历程

    现在很多人不是在学习数据分析的路上,就是在考虑要不要学数据分析的路上,无论是他或她之前所学的专业是理工学科还是文史学科,也无论他或她现在做的工作是不是数据类工作. 如此多的人学习数据分析,再次说明数据 ...

  7. 创业公司如何做数据分析(一)开篇

    在过去的一年里,笔者加入了一家移动互联网创业公司,工作之一便是负责数据业务的建设,陆陆续续完成了一些数据系统的实现,来满足公司的数据需求.在创业公司中做数据相关的事情,而且是从零做起,肯定不像很多大公 ...

  8. 创业公司做数据分析(一)开篇

    了解"认知心理学"的朋友应该知道:人类对事物的认知,总是由浅入深.然而,每个人思考的深度千差万别,关键在于思考的方式.通过提问三部曲:WHAT->HOW->WHY,可以 ...

  9. python做面板数据_用Python做数据分析的基本步骤(持续修改更新)

    一.环境搭建 数据分析最常见的环境是Anaconda+Jupyter notebook 二.导入包 2.1数据处理包导入 import numpy as np import pandas as pd ...

  10. 电商如何做数据分析?方法步骤+实战项目打包送,资深分析师整理

    电商如何做数据分析? 直接开门见山,不说废话,都是干货. 首先,纠正大家的一个想法:数据分析并不是要对工具有太多的要求,会基本的Excel数据透视表,图表可视化等基本操作即可,至于高端点的spss,P ...

最新文章

  1. 如何以及为什么使用Android Visibility Listeners
  2. res2net 测试
  3. 斯坦福大学CS229数学基础(线性代数、概率论)中文翻译版.pdf
  4. 发布 ASP.NET Core 应用
  5. 通过ID查询一个用户的两种开发方法
  6. mysql rpm包安装指定路径_安装rpm包时指定路径
  7. JAVA WEB篇3——JSP
  8. java redis 多节点,Redis单机多节点集群部署,超简单
  9. mysql中常见错误代码汇总
  10. mp4视频转gif图片
  11. mysql查看系统参数
  12. linux如何抓取本地socket,linux 本地socket
  13. Mahout实战---编写自己的相似度计算方法
  14. 用blender环绕物体拍摄
  15. android设置文件存储大小,Android实现把文件存放在SDCard的方法
  16. 靶机渗透练习97-hacksudo:ProximaCentauri
  17. 扫码支付是如何实现的?
  18. 蜻蜓FM信息流推荐探索与实践
  19. 安徽理科480分学计算机的大学,2021年安徽高考480分理科能上什么大学,安徽理科480分能上什么大学...
  20. 使用HttpURLConnection下载网络文件

热门文章

  1. 数据结构:线性表的顺序存储结构,实现集合的交差并补
  2. 三. 英语语法 - 名词和名词性从句
  3. matlab中角度,利用 matlab 计算各种角度
  4. 爬虫初接触——八爪鱼采集器
  5. Ubuntu安装过程之磁盘分区图文教程
  6. 安卓layout布局三等分
  7. 吐槽国内各大公司的漏洞报告平台
  8. CPU计算机性能的操作方法,把电脑CPU性能调到最大的三种方法
  9. 思科网络模拟器7.3.1版本的下载和安装
  10. 虚拟主机安装php,php网站怎么安装到虚拟主机