[机器学习]机器学习笔记整理12-线性回归概念理解
前提介绍:
为什么需要统计量?
统计量:描述数据特征
- 集中趋势衡量
均值(平均数,平均值)(mean)
这里写图片描述
{6, 2, 9, 1, 2}
(6 + 2 + 9 + 1 + 2) / 5 = 20 / 5 = 4
中位数 (median):
将数据中的各个数值按照大小顺序排列,居于中间位置的变量
给数据排序:1, 2, 2, 6, 9
找出位置处于中间的变量:2
当n为基数的时候:直接取位置处于中间的变量
当n为偶数的时候,取中间两个量的平均值
众数 (mode):
数据中出现次数最多的数
离散程度衡量
方差(variance)
这里写图片描述
{6, 2, 9, 1, 2}
(1) (6 - 4)^2 + (2 - 4) ^2 + (9 - 4)^2 + (1 - 4)^2 + (2 - 4)^2
= 4 + 4 + 25 + 9 + 4
= 46
(2) n - 1 = 5 - 1 = 4
(3) 46 / 4 = 11.5
标准差 (standard deviation)
这里写图片描述
介绍:回归(regression) Y变量为连续数值型(continuous numerical variable)
如:房价,人数,降雨量分类(Classification): Y变量为类别型(categorical variable)如:颜色类别,电脑品牌,有无信誉
- 简单线性回归(Simple Linear Regression)
2.1 很多做决定过过程通常是根据两个或者多个变量之间的关系
2.3 回归分析(regression analysis)用来建立方程模拟两个或者多个变量之间如何关联
2.4 被预测的变量叫做:因变量(dependent variable), y, 输出(output)
2.5 被用来进行预测的变量叫做: 自变量(independent variable), x, 输入(input)
- 简单线性回归介绍
3.1 简单线性回归包含一个自变量(x)和一个因变量(y)
3.2 以上两个变量的关系用一条直线来模拟
3.3 如果包含两个以上的自变量,则称作多元回归分析(multiple regression)
- 简单线性回归模型
4.1 被用来描述因变量(y)和自变量(X)以及偏差(error)之间关系的方程叫做回归模型
4.2 简单线性回归的模型是:
简单线性回归方程
E(y) = β0+β1x 这个方程对应的图像是一条直线,称作回归线其中,β0是回归线的截距β1是回归线的斜率 E(y)是在一个给定x值下y的期望值(均值)
- 正向线性关系:
这里写图片描述
- 负向线性关系:
这里写图片描述
- 无关系
这里写图片描述
估计的简单线性回归方程
ŷ=b0+b1x
这个方程叫做估计线性方程(estimated regression line)
其中,b0是估计线性方程的纵截距
b1是估计线性方程的斜率ŷ是在自变量x等于一个给定值的时候,y的估计值
- 线性回归分析流程:
这里写图片描述
- 关于偏差ε的假定
11.1 是一个随机的变量,均值为0
11.2 ε的方差(variance)对于所有的自变量x是一样的
11.3 ε的值是独立的
11.4 ε满足正态分布
[机器学习]机器学习笔记整理12-线性回归概念理解相关推荐
- 机器学习总结——机器学习课程笔记整理
机器学习笔记整理 说明 基础点整理 1. 基础数学知识 (1) 一些零七八碎的基础知识 (2) 最优化相关问题 (3) 概率论相关问题 (4) 矩阵相关问题 2. 回归(线性回归.Logistic回归 ...
- 干货|机器学习零基础?不要怕,吴恩达机器学习课程笔记2-多元线性回归
吴恩达Coursera机器学习课系列笔记 课程笔记|吴恩达Coursera机器学习 Week1 笔记-机器学习基础 1 Linear Regression with Multiple Variable ...
- 操作系统笔记整理12——磁盘存储器的管理
点此链接可跳转到:操作系统笔记整理--目录索引页 参考书籍:<计算机操作系统>第四版 汤小丹等编著 文章目录 点此链接可跳转到:操作系统笔记整理--目录索引页 外存的组织方式 连续组织方式 ...
- 【CV】吴恩达机器学习课程笔记 | 第1-2章
本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 1 介绍 1-3 监督学习 1-4 无监督学习 2 单变量 ...
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 12—Support Vector Machines 支持向量机...
Lecture 12 支持向量机 Support Vector Machines 12.1 优化目标 Optimization Objective 支持向量机(Support Vector Machi ...
- 吴恩达机器学习个人笔记03——多变量线性回归
目录 3.1 多维特征 3.2 多变量梯度下降 3.3 梯度下降法实践1-特征缩放 3.4 梯度下降法实践2-学习率 3.5 特征和多项式回归 3.6 正规方程 3.7 正规方程及不可逆性 下节将介绍 ...
- 李宏毅机器学习——学习笔记(12) Un-supervised Learning-Linear methods
Un-supervised Learning 分为两类: (1)聚类 & 降维(化繁为简):将多个输入抽象成一种类型 (2)Generation(无中生有):输入一个code,得到一个样本 聚 ...
- 动手学pytorch笔记整理12
conv-layer 二维卷积层 二维互相关运算 特征图和感受野 填充和步幅 填充 步幅 二维卷积层 卷积神经网络(convolutional neural network)是含有卷积层(convol ...
- 我爱机器学习--机器学习方向资料汇总
转载:http://blog.csdn.net/shuimanting520/article/details/45748505 机器学习爱好者资料 机器学习领域的几种主要学习方式 From Stump ...
- 吴恩达机器学习笔记整理(Week1-Week5)
吴恩达机器学习笔记整理 1. Week1 1.1 什么是机器学习(What is Machine Learning) 1.2机器学习算法分类 1.3 单变量线性回归(Linear Regression ...
最新文章
- ISR:中断服务程序需要满足的要求
- 内置h5 调用safari系统浏览器打开_开发教我做设计:移动端H5页面中的橡皮筋效果...
- python输入一个\输出2个\问题
- dog log 算子_DoG和LoG算子
- 谷歌查询mysql,谷歌地图:使用mysql查询更新标记不起作用
- springmvc 全局编码_SpringMVC请求参数和响应结果全局加密和解密
- 【零基础学Java】—Java 日期时间(三十二)
- http://blog.51cto.com/forsk/1531568
- chattr lsattr
- Spring源代码解析
- 构筑基于物联网操作系统的物联网生态环境【转】
- Linux下iwconfig权限,Linux系统中iwconfig命令使用详解
- debian 安装teamviewer
- 使用Servlet和JSP开发Java应用程序 ---- 豆瓣瓣项目(数据库 + JSP + Servlet)
- JavaScript案例:页面自动跳转到首页
- 计算机科学与技术选修课方向,计算机与科学专业主要的课程和学习方向是什么?...
- 如何获取对方精确位置
- 根据当前日期获取本周、本月、本季度相关日期
- Calendar的基本使用和属性说明
- 计算机机房ups电池常用配置表,机房UPS配置和解决方案
热门文章
- Mysql Federated Server 示例
- asp.net去掉HTML标记代码
- arm linux 64位,微软准备让Linux作为64位ARM Hyper-V客户机运行
- python弹幕代码_只需3 行代码就可以获取B站(弹幕、评论、用户)数据
- hdu1358 最小循环节,最大循环次数 KMP
- 【Android 逆向】APK 文件格式 ( Android 应用安装 | Zip 文件格式 | 使用 Python 代码提取 APK 文件 )
- 【Android 异步操作】Handler 机制 ( MessageQueue 空闲任务 IdleHandler 机制 )
- [Spring cloud 一步步实现广告系统] 16. 增量索引实现以及投送数据到MQ(kafka)
- WebUploader 上传图片回显
- restful api与传统api的区别(方式及语法)