线性回归

目的

试图学得一个线性模型以尽可能地预测实值输出标记(即学w,b)

形式/

向量形式

均方差MSE的推导

梯度下降法:

理解:

需要选择学习率,

是迭代求解,

特征数m很大时不影响

最小二乘法:

理解:

不需要选择学习率,

不是迭代求解:

特征数m很大时计算速度慢

感知机

抽象理解

权重

突触

偏置

阈值

激活函数

细胞体

分类模型

二分类线性模型

输入:特征向量

输出: 类别(+1, -1)

目标: 求超平面(能将训练数据集正负实例完全正确分开)

距离

点到线:

样本到超平面:

损失函数

正确分类:

错误分类:

目标: 使错误分类的样本到超平面的距离最小

感知机学习算法

输入:

  1. 训练数据集
  2. 学习率

输出:

  1. w,b
  2. 感知机模型f(x)=sign(wx+b)

过程:

  1. 初始化w和b, 通常是全0向量

(2)从训练集获取一个样本(x,y)

(3)如果y(wx+b)<=0, 按照梯度更新参数

(4)继续(2)直到没有样本被错误分类

感知机学习算法

假设:

算法执行了n(很多次)次才收敛, 参数的主部是增量. 即w变成ayx,

Gram本质:

x*x可以事先由gram矩阵,计算好, 只更新a即可.

过程:

  1. 初始化w和b, 通常是全零向量
  2. 从训练集获取一个样本(x,y)
  3. 如果y(axy*x+b)<=0, 则更新参数
  4. 继续(2)直到没有样本被错误分类

Gram减少运算量:

n是维数, N是样本个数

n过高时, 应选择对偶形式算法加速(原始算法主要是w和x的内积)

N很大时, 采用原始算法(对偶形式主要是输入实例之间的内积)

逻辑回归

逻辑回归的引入

将激活函数从感知机的”符号函数”替换成了, “sigmoid”函数, 即给出了隶属于各类别的概率

Logistic函数

二分类标签的后验概率

y=1

Y=0

交叉熵+梯度+参数更新

交叉熵:

梯度:

参数更新:

Softmax分类

argmax

如果使用某一类的参数(w, b)使得wx+b最大, 则结果分为该类

目标类别的条件概率

对比逻辑回归:

KL散度, 负对数似然

交叉熵+梯度下降

交叉熵:

梯度下降:

为什么逻辑回归用交叉熵损失而不用MSE?

答:  参数的更新公式中有激活函数, 如果接近0或1就会梯度消失陷入局部极小

深度学习基础----线性模型相关推荐

  1. 第3章(3.11~3.16节)模型细节/Kaggle实战【深度学习基础】--动手学深度学习【Tensorflow2.0版本】

    项目地址:https://github.com/TrickyGo/Dive-into-DL-TensorFlow2.0 UC 伯克利李沐的<动手学深度学习>开源书一经推出便广受好评.很多开 ...

  2. (十四)从零开始学人工智能-深度学习基础及CNN

    文章目录 一.深度学习基础 1.1 深度学习及其发展历史 1.1.1 什么是学习? 1.1.2 什么是机器学习? 1.1.3 什么是深度学习? 1.1.4 深度学习发展历史 1.1.5 小结 1.2 ...

  3. 【书摘】深度学习简史(摘抄自《深度学习基础与应用》)

    本文内容摘抄自 <深度学习基础与应用> 北京理工大学出版社 武玉伟 等编著 2020年4月出版 ISBN:978-7-5682-8373-1 该书绪论中讲到 人工智能和深度学习的发展历史, ...

  4. 二分类交叉熵损失函数python_【深度学习基础】第二课:softmax分类器和交叉熵损失函数...

    [深度学习基础]系列博客为学习Coursera上吴恩达深度学习课程所做的课程笔记. 本文为原创文章,未经本人允许,禁止转载.转载请注明出处. 1.线性分类 如果我们使用一个线性分类器去进行图像分类该怎 ...

  5. 基于人脸的常见表情识别(1)——深度学习基础知识

    基于人脸的常见表情识别(1)--深度学习基础知识 神经网络 1. 感知机 2. 多层感知机与反向传播 卷积神经网络 1. 全连接神经网络的2大缺陷 2. 卷积神经网络的崛起 卷积神经网络的基本网络层 ...

  6. 独家思维导图!让你秒懂李宏毅2020深度学习(三)——深度学习基础(神经网络和反向传播部分)

    独家思维导图!让你秒懂李宏毅2020深度学习(三)--深度学习基础(神经网络和反向传播部分) 长文预警!!!前面两篇文章主要介绍了李宏毅视频中的机器学习部分,从这篇文章开始,我将介绍李宏毅视频中的深度 ...

  7. 第二次作业:“深度学习基础”

    第二次作业:"深度学习基础" 完成一篇博客,题目为 " 第二次作业:深度学习基础 " 第二次软工作业 第二次作业:"深度学习基础" 一.视频 ...

  8. 资源 | Intel发布AI免费系列课程3部曲:机器学习基础、深度学习基础以及TensorFlow基础

    翻译 | AI科技大本营(公众号ID:rgznai100) 校对 | 成龙 编辑 | 明明 Intel于近期发布了三门AI系列的免费课程,分别是关于机器学习基础.深度学习基础.TensorFlow基础 ...

  9. 深度估计相关原理(计算机视觉和深度学习基础)

    今天来和大家介绍一下深度估计涉及到的理论知识点,包括计算机视觉基础和深度学习基础. 一.计算机视觉基础 1.1. 针孔相机模型 相机模型,是指采用一个几何模型来描述三维世界中的坐标点映射到二维图像平面 ...

最新文章

  1. 用C#实现FTP搜索引擎
  2. C# 打印多页tif
  3. Echarts(自己整理的一些散点图、饼图、条形图、散点图的基本配置参数)
  4. Mybatis报错: Invalid bound statement (not found)...
  5. IBM计划未来四年在美聘用2000名退伍军人
  6. 读人、看人、做人(图)
  7. display inline-block 垂直居中
  8. android 代码设置dialog 全屏,Android里把Dialog设置为全屏的方法
  9. Qt5.7+Opencv2.4.9人脸识别(四)模型训练
  10. Java基础学习总结(164)——别让Lombok使你的Java代码处于“亚健康”状态
  11. 【转】selenium之 定位以及切换frame
  12. java 源码分析1 -String
  13. iptables常用
  14. 8051 r0-r7 是什么
  15. type=file的未选择任何文件修改_Electron应用易“招黑”,轻松被修改并植入后门...
  16. CTFHub | HG泄露
  17. SQL 当天在当月、当季度、当年的时间进度
  18. P2184 贪婪大陆 线段树(优化:区间修改变为单点修改)
  19. 一本书让你知道互联网思维 个人总结
  20. 2018SCAU校赛题解

热门文章

  1. java计算机毕业设计教师管理系统源码+mysql数据库+系统+lw文档+部署
  2. 实现一个简单的类似于手电筒的功能@[电灯泡]
  3. Python语言的动态性:运行时动态绑定,删除属性和方法
  4. 一例Vmware虚拟化Vcenter连接不上解决过程。
  5. 【论文阅读】ICLR 2022: Scene Transformer: A unified architecture for predicting future trajectories of ...
  6. Unity颜色转换(HtmlString和Color)
  7. 桌前检查、代码评审、走查
  8. LimeSDR srsLTE实验
  9. python控制雷电模拟器 代码修复
  10. K-means(K均值原型聚类)