前提介绍:

为什么需要统计量?

统计量:描述数据特征

  1. 集中趋势衡量

均值(平均数,平均值)(mean)
这里写图片描述
{6, 2, 9, 1, 2}
(6 + 2 + 9 + 1 + 2) / 5 = 20 / 5 = 4

中位数 (median):

将数据中的各个数值按照大小顺序排列,居于中间位置的变量
给数据排序:1, 2, 2, 6, 9
找出位置处于中间的变量:2
当n为基数的时候:直接取位置处于中间的变量
当n为偶数的时候,取中间两个量的平均值

众数 (mode):

数据中出现次数最多的数

离散程度衡量

方差(variance)

这里写图片描述
{6, 2, 9, 1, 2}
(1) (6 - 4)^2 + (2 - 4) ^2 + (9 - 4)^2 + (1 - 4)^2 + (2 - 4)^2
= 4 + 4 + 25 + 9 + 4
= 46
(2) n - 1 = 5 - 1 = 4
(3) 46 / 4 = 11.5

标准差 (standard deviation)

这里写图片描述

  1. 介绍:回归(regression) Y变量为连续数值型(continuous numerical variable)

                如:房价,人数,降雨量分类(Classification): Y变量为类别型(categorical variable)如:颜色类别,电脑品牌,有无信誉
  2. 简单线性回归(Simple Linear Regression)

2.1 很多做决定过过程通常是根据两个或者多个变量之间的关系
2.3 回归分析(regression analysis)用来建立方程模拟两个或者多个变量之间如何关联
2.4 被预测的变量叫做:因变量(dependent variable), y, 输出(output)
2.5 被用来进行预测的变量叫做: 自变量(independent variable), x, 输入(input)

  1. 简单线性回归介绍

3.1 简单线性回归包含一个自变量(x)和一个因变量(y)
3.2 以上两个变量的关系用一条直线来模拟
3.3 如果包含两个以上的自变量,则称作多元回归分析(multiple regression)

  1. 简单线性回归模型

4.1 被用来描述因变量(y)和自变量(X)以及偏差(error)之间关系的方程叫做回归模型
4.2 简单线性回归的模型是:

  1. 简单线性回归方程

                     E(y) = β0+β1x 这个方程对应的图像是一条直线,称作回归线其中,β0是回归线的截距β1是回归线的斜率  E(y)是在一个给定x值下y的期望值(均值)
  2. 正向线性关系:

这里写图片描述

  1. 负向线性关系:

这里写图片描述

  1. 无关系

这里写图片描述

  1. 估计的简单线性回归方程

      ŷ=b0+b1x

    这个方程叫做估计线性方程(estimated regression line)

其中,b0是估计线性方程的纵截距

       b1是估计线性方程的斜率ŷ是在自变量x等于一个给定值的时候,y的估计值
  1. 线性回归分析流程:

这里写图片描述

  1. 关于偏差ε的假定

11.1 是一个随机的变量,均值为0
11.2 ε的方差(variance)对于所有的自变量x是一样的
11.3 ε的值是独立的
11.4 ε满足正态分布

[机器学习]机器学习笔记整理12-线性回归概念理解相关推荐

  1. 机器学习总结——机器学习课程笔记整理

    机器学习笔记整理 说明 基础点整理 1. 基础数学知识 (1) 一些零七八碎的基础知识 (2) 最优化相关问题 (3) 概率论相关问题 (4) 矩阵相关问题 2. 回归(线性回归.Logistic回归 ...

  2. 干货|机器学习零基础?不要怕,吴恩达机器学习课程笔记2-多元线性回归

    吴恩达Coursera机器学习课系列笔记 课程笔记|吴恩达Coursera机器学习 Week1 笔记-机器学习基础 1 Linear Regression with Multiple Variable ...

  3. 操作系统笔记整理12——磁盘存储器的管理

    点此链接可跳转到:操作系统笔记整理--目录索引页 参考书籍:<计算机操作系统>第四版 汤小丹等编著 文章目录 点此链接可跳转到:操作系统笔记整理--目录索引页 外存的组织方式 连续组织方式 ...

  4. 【CV】吴恩达机器学习课程笔记 | 第1-2章

    本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 1 介绍 1-3 监督学习 1-4 无监督学习 2 单变量 ...

  5. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 12—Support Vector Machines 支持向量机...

    Lecture 12 支持向量机 Support Vector Machines 12.1 优化目标 Optimization Objective 支持向量机(Support Vector Machi ...

  6. 吴恩达机器学习个人笔记03——多变量线性回归

    目录 3.1 多维特征 3.2 多变量梯度下降 3.3 梯度下降法实践1-特征缩放 3.4 梯度下降法实践2-学习率 3.5 特征和多项式回归 3.6 正规方程 3.7 正规方程及不可逆性 下节将介绍 ...

  7. 李宏毅机器学习——学习笔记(12) Un-supervised Learning-Linear methods

    Un-supervised Learning 分为两类: (1)聚类 & 降维(化繁为简):将多个输入抽象成一种类型 (2)Generation(无中生有):输入一个code,得到一个样本 聚 ...

  8. 动手学pytorch笔记整理12

    conv-layer 二维卷积层 二维互相关运算 特征图和感受野 填充和步幅 填充 步幅 二维卷积层 卷积神经网络(convolutional neural network)是含有卷积层(convol ...

  9. 我爱机器学习--机器学习方向资料汇总

    转载:http://blog.csdn.net/shuimanting520/article/details/45748505 机器学习爱好者资料 机器学习领域的几种主要学习方式 From Stump ...

  10. 吴恩达机器学习笔记整理(Week1-Week5)

    吴恩达机器学习笔记整理 1. Week1 1.1 什么是机器学习(What is Machine Learning) 1.2机器学习算法分类 1.3 单变量线性回归(Linear Regression ...

最新文章

  1. ISR:中断服务程序需要满足的要求
  2. 内置h5 调用safari系统浏览器打开_开发教我做设计:移动端H5页面中的橡皮筋效果...
  3. python输入一个\输出2个\问题
  4. dog log 算子_DoG和LoG算子
  5. 谷歌查询mysql,谷歌地图:使用mysql查询更新标记不起作用
  6. springmvc 全局编码_SpringMVC请求参数和响应结果全局加密和解密
  7. 【零基础学Java】—Java 日期时间(三十二)
  8. http://blog.51cto.com/forsk/1531568
  9. chattr lsattr
  10. Spring源代码解析
  11. 构筑基于物联网操作系统的物联网生态环境【转】
  12. Linux下iwconfig权限,Linux系统中iwconfig命令使用详解
  13. debian 安装teamviewer
  14. 使用Servlet和JSP开发Java应用程序 ---- 豆瓣瓣项目(数据库 + JSP + Servlet)
  15. JavaScript案例:页面自动跳转到首页
  16. 计算机科学与技术选修课方向,计算机与科学专业主要的课程和学习方向是什么?...
  17. 如何获取对方精确位置
  18. 根据当前日期获取本周、本月、本季度相关日期
  19. Calendar的基本使用和属性说明
  20. 计算机机房ups电池常用配置表,机房UPS配置和解决方案

热门文章

  1. Mysql Federated Server 示例
  2. asp.net去掉HTML标记代码
  3. arm linux 64位,微软准备让Linux作为64位ARM Hyper-V客户机运行
  4. python弹幕代码_只需3 行代码就可以获取B站(弹幕、评论、用户)数据
  5. hdu1358 最小循环节,最大循环次数 KMP
  6. 【Android 逆向】APK 文件格式 ( Android 应用安装 | Zip 文件格式 | 使用 Python 代码提取 APK 文件 )
  7. 【Android 异步操作】Handler 机制 ( MessageQueue 空闲任务 IdleHandler 机制 )
  8. [Spring cloud 一步步实现广告系统] 16. 增量索引实现以及投送数据到MQ(kafka)
  9. WebUploader 上传图片回显
  10. restful api与传统api的区别(方式及语法)