softmax回归

  • 分类和回归的区别
    • 无校验比例
    • 校验比例
    • 交叉熵
  • 常见损失函数
    • 均方误差 L2 loss
    • 绝对值损失L1 loss
    • 鲁棒损失
  • 图像分类数据集

分类和回归的区别

回归:估计一个连续值
分类:分类预测一个离散类别

无校验比例

在分类时不关心分类的值,关心对正确类别的置信度。就是要使得分类正确类别能够远大于分类出其他类别。使得预测这个分类可信。

校验比例

希望能将置信度都规范到一个区间内,方便后面的操作。就引入了softmax操作,就是将每个置信度都变为指数,保证是非负值。然后再做归一化。那么就可以把一个类别的比例作为概率。那么就可以把预测的概念和真实的概念做一个损失。

交叉熵

一般来采用交叉熵来衡量两个概率之间的区别。

常见损失函数

均方误差 L2 loss

绝对值损失L1 loss

如果在靠近原点的地方不想要那么大的梯度。则可以用L1 loss。缺点是在0地方不可导,在优化后期不稳定。

鲁棒损失

图像分类数据集

MNIST数据集是图像分类中广泛使用的数据集之一,但作为基准数据集过于简单。我们将使用类似但更复杂的Fashion-MNIST数据集。

Fashion_mnist数据集读取视频

softmax从零开始实现
softmax用torch实现

跟李沐学深度学习-softmax回归相关推荐

  1. 动手学深度学习——softmax回归之OneHot、softmax与交叉熵

    目录 一.从回归到多类分类 1. 回归估计一个连续值 2. 分类预测一个离散类别 二.独热编码OneHot 三.校验比例--激活函数softmax 四.损失函数--交叉熵 五.总结 回归可以用于预测多 ...

  2. 李沐的深度学习笔记来了!

    Datawhale干货 来源:机器之心,编辑:张倩 markdown笔记与原课程视频一一对应,Jupyter代码均有详细中文注释,这份学习笔记值得收藏. 去年年初,机器之心知识站上线了亚马逊资深首席科 ...

  3. 【深度学习】李沐的深度学习笔记来了!

    转载自 | 机器之心 去年年初,机器之心知识站上线了亚马逊资深首席科学家李沐博士的「动手学深度学习」中文系列课程.这门课从3月持续到8月,超过28000人参与了直播,课程回放在 B 站的播放量达到了上 ...

  4. 【跟李沐学AI学习笔记】数据操作

    本文的来源是B站跟李沐学AI的视频. 机器学习用的最多的数据结构是N维数组.最简单的N维数组是一个0-d的标量,比如1.0,它可能表示一个物体的类别.1-d的数组称为向量,比如说[1.0, 2.7, ...

  5. 抽奖啦!AI内参、李沐新书深度学习、米家扫地机器人送送送

    编辑部 发自 凹非寺 量子位 | 公众号 QbitAI 今年六一时,量子位发起了一次抽奖,向10位读者朋友送出酷酷的量子位厂服T恤.在此先恭喜各位中奖的小伙伴,你们的奖品已经全部寄出啦~ 这次,为了让 ...

  6. 【李沐】深度学习笔记

    一.深度学习基础知识 记录:当时学习李沐深度学习的笔记内容,后续继续补充. 04 数据操作 + 数据预处理 大小为1的 tensor 可以直接转成一个标量 数据预处理 用pd.np来做 05 线性代数 ...

  7. 深度学习-softmax回归

    softmax regression 1- softmax 基本概念 1-1 极大似然估计 2- Fashion-MNIST图像分类数据集 2-1 下载数据集 2-2 可视化 3- softmax回归 ...

  8. 深度学习——Softmax回归+损失函数(笔记)

    一.Softmax回归 1.Softmax回归,名字是回归,其实是一个分类问题. 2.回归和分类的区别是什么? ①回归估计的是一个连续值:比如预测二手房卖出的价格 Ⅰ回归是在自然区间R单连续值的输出 ...

  9. 李沐-->深度学习计算

    文章目录 前言 一.层和块 1. 层和块 1.1 自定义块 1.2. 顺序块 1.3. 在前向传播函数中执行代码 二.参数管理 1.如何访问参数 1.1.访问某一个具体的参数 1.2.一次性访问所有参 ...

最新文章

  1. java开源的cms系统jsp cms系统
  2. JavaScript - JavaScript自定义弹出对话框
  3. 蓝桥杯 历届试题 分考场(DFS+枚举)
  4. CentOS 6.4配置TL-WN823N外置无线网卡
  5. Java9新功能之HTTP2和REPL
  6. iservice封装有哪些方法_请问这段Java代码能不能封装成一个方法
  7. java string 反序列化_如何将java.lang.String的空白JSON字符串值反序列化为null?
  8. token和session的区别
  9. dj鲜生-22-模板抽离-列表页详情页模板的抽离-base_detail_list
  10. 谨防 ActiveSupport::Cache::Store 缓存 nil 值
  11. 读取jar包所在目录和jar包内文件
  12. 太平洋女性网焦点图的几种写法
  13. plc原理及应用_PLC编程与应用 适合初学者
  14. 系统集成项目管理工程师中高级一次通过经验之谈
  15. 入门企业品牌短视频运营
  16. 安装 dpdk-ans 时的编译问题:librte_ans.a(ans_init.o): unrecognized relocation (0x2a) in section `.text'
  17. FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding个人理解
  18. 数据从hana倒回Oracle的方法,SAP HANA SLT 将Oracle表 数据同步到HANA数据库
  19. dns配置异常怎么修复_dns配置异常不能上网如何修复
  20. Linux搭建tor网络环境

热门文章

  1. 计算机考试的话语,为考试加油的暖心句子 期末考试加油鼓励的话
  2. buffon针的概率算法
  3. 政治冲刺押题所有“黑幕”!只用肖四肖八行吗?
  4. ImageNet预训练参数和随机初始化参数训练效果对比
  5. 计算机省二打字,巧用音频转文字,省去打字烦恼
  6. ElasticSearch服务(一)
  7. 5.1 OpenStack
  8. Linux 提权总结
  9. Kubernetes——service管理
  10. 支付宝手机网页唤醒app支付