【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】1. 线性分类器
视频连接 https://www.bilibili.com/video/BV1V54y1B7K3?p=2&spm_id_from=pageDriver
1. 前言
1.1 数据驱动的图像分类方法
- 数据集构建
- 分类器设计与学习
- 分类器决策
1.2 常用分类任务的指标
2. 线分类器
2.1 基于图像的表示
2.1.1 图像类型
- 二进制图像
非黑即白,0表示黑,1表示白
- 灰度图像
每一个像素点由(0-255)表示,0是最黑,255是最白
- 彩色图像
RGB三个通道每种颜色0-255
2.1.2 图像表示
大多数的算法都要求输入向量
将图像转换成向量的方法有很多,最简单的方法就是直接将图像矩阵转换成向量
有一张32*32的彩色图像转换成向量是多少维度?
2.2 线性分类器
为什么从线性分类器开始
- 形式简单易于理解
- 通过层级结构(神经网络)或者高维映射(支撑向量机)可以形成功能强大的非线性模型
2.2.1 什么是线性分类器
线性分类器是一种线性映射,将输入的图像特征映射为类别分数。
2.2.2 线性分类器的定义
2.2.3 线性分类器的决策
线性分类器示例
- 任务:为图片分配类别标签(汽车类、猫类、鸟类)
线性分类器决策步骤:
- 将图像表示成向量
- 计算当前图片每个类别的分数
- 按类别得分判定当前图像
线性分类器的矩阵表示为
2.2.4 线性分类器的权值向量
2.2.5 线性分类器的决策边界
3 损失函数
3.1 损失函数的定义
- 什么是损失函数? 损失函数搭建了模型性能与模型参数之间的桥梁,指导模型参数的优化。
- 损失函数是一个函数,用于度量给定分类器的预测值与真实值的不一致程度,其输出通常是一个非负实值。
- 其输出的非负实值可以作为反馈信号来对分类器参数进行调整,以降低当前示例对应的损失值,提升分类器的分类效果。
损失函数的一般定义为:
3.2 多类支撑向量机损失
重新说明
用图来表示,X轴表示Syi,Sij是固定值,折线为45度角
max(0,.)损失-常称为折页损失
举例:
问答:
- 答案
- 最大是无穷、最小是0
- 在是个类别的样本中,极端情况下假设w和b都设为0,那么Li为9。平均损失L也为9。这个值可以作为我门编码的评判,初始化w和b很小时,损失L应该是接近分类别数减1,也就是这个样本中接近9。
- 大1
- 放大了N倍
- 对模型有影响
3.3 正则项多参数
3.3.1 正则项及损失
问题:假设存在一个W使损失函数L=0,这个W是唯一的吗?
答: 不唯一,因为W2同样有L=0,应该如何在W1和W2做出选择?
- 由此引入正则项
3.3.2 超参数
3.3.3 L2正则项损失
- 正则项损失有主要三个作用
- 让损失解唯一
- 防止模型过拟合
- 让模型有了偏好,喜欢 权值分散的
3.3.4 常用的正则项损失
4. 优化算法
4.1 什么是参数优化
参数优化是机器学习的核心步骤之一,它利用损失函数的输出作为反馈信号来调整分类器参数,以提升分类器对训练样本的预测性能。
4.2 优化算法的目标
由此引入梯度下降方法
4.3 梯度下降算法
- 一种简单而高效的迭代优化方法!
4.3.1 梯度计算
- 梯度计算总结
4.3.2 梯度计算算法的计算效率
一个epoch=N/m;
- 最后总结
五、数据集划分
但是如果样本很少的话,那么可能验证集包含的样本就太少,从而无法在统计
上代表数据。
这个问题很容易发现:如果在划分数据前进行不同的随机打乱,最终得到的
模型性能差别很大,那么就存在这个问题。
由此引入k折交叉验证(除测试集以外,所有的样本划分为训练集和验证集,划分为几份就是几折)
另外还有带有打乱数据的重复K折验证
分划分训练一次,就打乱数据重新划分,进行下一次
六、数据预处理
数据能否直接使用,有哪些处理方式?
- 方法一:
- 方法二
【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】1. 线性分类器相关推荐
- 笔记:计算机视觉与深度学习-北邮-鲁鹏-2020年录屏-第一讲
笔记:计算机视觉与深度学习-北邮-鲁鹏-2020年录屏 写在开头(重复的) 1.课程来源:B站视频. 2.笔记目的:个人学习+增强记忆+方便回顾 3.时间:2021年4月8日 4.同类笔记链接:(钩子 ...
- 【计算机视觉】计算机视觉与深度学习-北邮鲁鹏老师课程笔记
计算机视觉与深度学习-北邮鲁鹏老师课程笔记 01-计算机视觉相关介绍 02-图像分类 03-全连接神经网络 04-图像去噪&卷积&边缘提取 05-纹理表示&卷积神经网络 06- ...
- 计算机视觉(本科课程) 北京邮电大学 鲁鹏
计算机视觉 2020 北京邮电大学本科课程 这里的计算机视觉中的数学都是比较简单的,不如图形学 课程部分内容 计算机视觉 2020 北京邮电大学本科课程 1. 卷积与边缘提取 锐化 边缘检测 2. 拟 ...
- 【简易笔记】计算机视觉与深度学习(全连接神经网络、卷积) EP2
本篇承接上文:计算机视觉与深度学习 EP1 本篇主要内容: 全连接神经网络(P4 - P6) 卷积与卷积神经网络(P7 - P8) 经典网络分析(P9 - P10) 可视化(P12 - P13) 主要 ...
- 计算机视觉与深度学习-全连接神经网络
以下内容是自己学习北京邮电大学鲁鹏副教授计算机视觉与深度学习课程(A02)的一些笔记, 笔者能力有限,如有错误还望各位大佬在评论区批评指正 . 先贴一下课程官网:CV-XUEBA 篇3地址:计算机视觉 ...
- 【计算机视觉】计算机视觉与深度学习-01-计算机视觉相关介绍-北邮鲁鹏老师课程笔记
计算机视觉与深度学习-01-计算机视觉相关介绍 前言 图像处理 vs 计算机视觉 图像处理 计算机视觉 相关课程 计算机视觉简介 计算机视觉顶级会议 计算机视觉的目标 图像中的信息 三维场景的结构信息 ...
- 乔治亚大学招收计算机视觉/深度学习/机器人/自动驾驶博士生from 2023 spring
University of Georgia(佐治亚大学)ECE系的Intelligent Vision and Sensing 实验室现有多个全奖博士生名额,以及1-2个csc资助的博士名额(学费由导 ...
- 计算机视觉与深度学习第三章:线性分类器
计算机视觉与深度学习 本文按照北京邮电大学计算机学院鲁鹏老师的计算机视觉与深度学习课程按章节进行整理,需要的同学可借此系统学习该课程详尽知识~ 第三章 线性分类器 计算机视觉与深度学习 本节重点 一. ...
- 计算机视觉与深度学习第七章:经典网络分析
本文按照北京邮电大学计算机学院鲁鹏老师的计算机视觉与深度学习课程按章节进行整理,需要的同学可借此系统学习该课程详尽知识~ 第七章 经典网络分析 ImageNet大规模视觉识别挑战赛(ILSVRC) 一 ...
最新文章
- python对象一定要删除引用吗_Python:删除自引用对象
- c语言程序 实现简单计算器功能,C语言实现简单计算器小项目
- 应运而生的web页面响应布局
- 网易云信:要做就做轻量级、小而美的云产品
- Spark on K8S 的现状与挑战
- Qt 如何发送和接收UDP数据报
- python 重写断言_历时四年,Dropbox 用 Rust 重写同步引擎核心代码
- 2019_7_30python
- html文本分类输出,构建中文网页分类器对网页进行文本分类
- 为什么说嵌入式开发比单片机要难很多?
- Eclipse安装最新SVN插件方法
- docker image设置jdk版本_Docker 部署 Spring Boot
- 计算机处理器的参数及意义,如何看懂CPU的性能参数?
- 阅读作业二-----读Lost in CatB有感 by 李栋
- Codeforces Round #295 (Div. 1) C. Pluses everywhere
- Access操作的注意事项
- docker for windows pull镜像文件的安装位置改变方法
- 电子邮件服务器-PostFix
- FOREACH的遍历
- 四两拨千斤——你不知道的VScode编码TypeScript的技巧
热门文章
- 雅思阅读考点词-同义替换
- 微信定位当前城市 php,html5,javascript_微信内置浏览器如何定位用户所在城市,html5,javascript - phpStudy...
- 赖世雄老师---不完全不及物动词---become/turn/get/seem及感官动词
- 单片机数字钟(调时,调时闪烁,万年历,年月日)超详细解析
- 双目立体视觉(3)- ZED2 ROS Melodic 发布RGB图像及深度信息
- 五一节后收心大法,一个便签让满血复活
- 陈艾盐:春燕百集访谈节目第二十六集
- hdu5879 Cure( 1/(n^2)的快速收敛性质)
- android 熄屏后仍然可以点击,Android - 在不触发睡眠/锁定屏幕的情况下关闭显示屏 - 使用触摸屏打开...
- Android锁屏状态下点亮屏幕并弹窗提醒