机器学习(李宏毅)—— Linear Regression
Regression:输入可以是股票市场的各种指数、自动驾驶的检测角度、大数据推荐系统,输出是数字。
实例:宝可梦的CP值(战斗力)预测
输入的内容包含
,分别代表宝可梦的当前战斗力,种类,生命力,体重和身高;输出则是进化后宝可梦的战斗力。即
,
就是我们要找的函数。
Step1:函数(或者称为模型Model)
假设函数为,综合考虑影响宝可梦战斗力的其他因素,可以得到更为全面的Linear Model:
,
是输入
的feature、
是权重、
是bias。
Step2:函数的性能评价
定义损失函数Loss Function,
是当前宝可梦的真实战斗力。输入是上述函数
,输出是该函数的性能评价。
Step3:筛选最好的函数
或者
,采用Gradient Descent方法筛选出最好的函数。对于上述损失函数
:
- 随机选取一个初始值
- 计算
,令
,
是学习率
- 重复上述两步......
对于Linear Model,根据梯度下降方法得到的局部最优解同时也是全局最优解(凸优化理论)。分别得到该模型在训练集和数据集的错误率,可以发现适量增加
的次数可以减少错误率(重构模型为
时在测试集上的错误率最低)。
Underfitting(欠拟合):模型不能很好的拟合训练集的数据,即模型有很大的bias(偏差)。
Overfitting(过拟合):模型可以很好的拟合训练集的数据,但是在测试集上有很大的误差,即模型有很大的variance(方差)。当模型越来越复杂时,bias越来越小而variance会变大。
对于欠拟合,可以重新设计模型:在输入上增加更多的特征;更复杂的模型。对于过拟合,可以从数据集和模型两个方面进行处理:更多的数据集(非常有效,但不是一直奏效);regularization(正则化,使模型的预测曲线趋于平滑,但有可能增大bias)。
将原始训练集划分为Training(新训练集)和Validation(验证集):训练集是为了训练模型,验证集是为了筛选最好的模型。还可以将原始训练集划分为两份新训练集和一份验证集(循环划分)。
机器学习(李宏毅)—— Linear Regression相关推荐
- python中的linearregression_【python+机器学习(2)】python实现Linear Regression
欢迎关注哈希大数据微信公众号[哈希大数据] python实现多元线性回归算法(lr) 想必大家在很早之前就接触过函数的概念,即寻找自变量和因变量之间的对应关系,一元一次.多元一次.一元二次等等,表示的 ...
- 机器学习之线性回归(Linear Regression)
线性学习中最基础的回归之一,本文从线性回归的数学假设,公式推导,模型算法以及实际代码运行几方面对这一回归进行全面的剖析~ 一:线性回归的数学假设 1.假设输入的X和Y是线性关系,预测的y与X通过线性方 ...
- 机器学习之单变量线性回归(Linear Regression with One Variable)
机器学习之单变量线性回归(Linear Regression with One Variable) 1. 模型表达(Model Representation) 我们的第一个学习算法是线性回归算法,让我 ...
- 机器学习之多变量线性回归(Linear Regression with multiple variables)
机器学习之多变量线性回归(Linear Regression with multiple variables) 1. Multiple features(多维特征) 在机器学习之单变量线性回归(Lin ...
- Coursera公开课笔记: 斯坦福大学机器学习第四课“多变量线性回归(Linear Regression with Multiple Variables)”
Coursera公开课笔记: 斯坦福大学机器学习第四课"多变量线性回归(Linear Regression with Multiple Variables)" 斯坦福大学机器学习第 ...
- Coursera公开课笔记: 斯坦福大学机器学习第二课“单变量线性回归(Linear regression with one variable)”
Coursera公开课笔记: 斯坦福大学机器学习第二课"单变量线性回归(Linear regression with one variable)" 发表于 2012年05月6号 由 ...
- 机器学习-线性回归(Linear Regression)
目录 1.什么是线性回归 2. 能够解决什么样的问题 3. 一般表达式是什么 4. 如何计算 4.1 Loss Function--MSE 4.2 标准方程方法 5. 过拟合问题如何解决 5.1 什么 ...
- linearregression_机器学习-TensorFlow建模过程 Linear Regression线性拟合应用
TensorFlow是咱们机器学习领域非常常用的一个组件,它在数据处理,模型建立,模型验证等等关于机器学习方面的领域都有很好的表现,前面的一节我已经简单介绍了一下TensorFlow里面基础的数据结构 ...
- 机器学习基础-吴恩达-coursera-(第一周学习笔记)----Introduction and Linear Regression
课程网址:https://www.coursera.org/learn/machine-learning Week 1 -- Introduction and Linear Regression 目录 ...
- 机器学习实战(七)线性回归(Linear Regression)
目录 0. 前言 1. 假设函数(Hypothesis) 2. 标准线性回归 2.1. 代价函数(Cost Function) 2.2. 梯度下降(Gradient Descent) 2.3. 特征缩 ...
最新文章
- Tokyo Tyrant(TTServer)系列(三)-Memcache协议
- Redis : redis事务
- Codeforces940(A-F)
- “玲珑杯”线上赛 Round #15 河南专场 F		咸鱼文章
- 【数据结构】4.1图的创建及DFS深度遍历(不完善)
- Linux设置封包报头的函数,GitHub - LinuxDigger/RTMP
- 微信小程序 git代码管理使用的详细步骤
- 判断一个对象是否属于某一类
- 云南计算机专升本经验分享
- java h5在线音频_H5 录音音频可视化
- 在virtualbox中导入.vmdk文件
- IP地址 、域名、 URL、 端口
- html标签之视频各种标签
- 【数据科学家】什么是数据科学?
- Qt运行提示QGtkStyle was unable to detect the current GTK+ theme.解决方法
- CTR---DIN原理,及deepctr组网实现DIN
- 手把手带大家搭建一个java个人网站(腾讯云为例)
- r语言中进行数据可视化_R中的数据可视化
- 单词接龙 单词接龙的规则是
- kotlin Unresolved reference报错解决记录