模型选择 + 过拟合和欠拟合 动手学深度学习v2 pytorch
1. 训练误差和泛化误差
- 训练误差:模型在训练数据上的误差(比如:模拟高考,可以有很多次)
- 泛化误差:模型在新数据上的误差(比如:真实高考,只有一次)
K-则交叉验证
2. 过拟合和欠拟合
模型容量:模型的复杂度
简单数据集:比如线性模型的数据,比如ax+b=y
复杂数据集举例:ImageNet
2.1 VC 维
- 统计学习理论的一个核心思想
- 对于一个分类模型,VC等于一个最大的数据集的大小,不管如何给定标号,都存在一个模型来对它进行完美分类。
3. 代码样例 过拟合 欠拟合
4. QA
- SVM很难训练100万的数据量,SVM可以调的参数很少,特征的分类,提取是分开处理的;神经网络GPT 3 训练的参数都超过1750亿个。神经网络是个语言,可以做很灵活编程。
- k则交叉验证,在神经网络上用的比较少,因为数据集都比较大。k则交叉验证应用于数据比较少的情况,k的选择原则,在于能接受的计算量的情况下。
- 深度学习 打败 svm ,因为效果很好,比如图片识别的精度很高,但是深度学习可解释性不好。svm 打败 多层感知机,因为svm有理论证明,并且容易调参,并且可调参数很少,比较简单。
- VC维衡量模型,简单来说是可以记住的数的维度,比如能备注π的100位小数,就是100VC维。
- 科学、工程、艺术:神经网络有一部分是艺术,可解释性不强,靠猜测。
参考
https://www.bilibili.com/video/BV1kX4y1g7jp?p=1
模型选择 + 过拟合和欠拟合 动手学深度学习v2 pytorch相关推荐
- 含并行连结的网络 GoogLeNet / Inception V3 动手学深度学习v2 pytorch
1. 含并行连结的网络 GoogLeNet 第一个神经网络可以做到超过100层. Inception 块的名字,取自盗梦空间,就是不断深入到梦境中,不断深入. Inception 使得参数减少,计算量 ...
- 【动手学深度学习v2李沐】学习笔记07:权重衰退、正则化
前文回顾:模型选择.欠拟合和过拟合 文章目录 一.权重衰退 1.1 硬性限制 1.2 柔性限制(正则化) 1.3 参数更新法则 1.4 总结 二.代码实现 2.1 从零开始实现 2.1.1 人工数据集 ...
- (d2l-ai/d2l-zh)《动手学深度学习》pytorch 笔记(2)前言(介绍各种机器学习问题)以及数据操作预备知识Ⅰ
开源项目地址:d2l-ai/d2l-zh 教材官网:https://zh.d2l.ai/ 书介绍:https://zh-v2.d2l.ai/ 笔记基于2021年7月26日发布的版本,书及代码下载地址在 ...
- (d2l-ai/d2l-zh)《动手学深度学习》pytorch 笔记(4)线性神经网络(暂停)
开源项目地址:d2l-ai/d2l-zh 教材官网:https://zh.d2l.ai/ 书介绍:https://zh-v2.d2l.ai/ 笔记基于2021年7月26日发布的版本,书及代码下载地址在 ...
- 动手学深度学习v2 p1引言 监督学习与无监督学习
1.引言 1.2. 机器学习中的关键组件 首先介绍一些核心组件.无论什么类型的机器学习问题,都会遇到这些组件: 可以用来学习的数据(data): 如何转换数据的模型(model): 一个目标函数(ob ...
- (d2l-ai/d2l-zh)《动手学深度学习》pytorch 笔记(3)前言(介绍各种机器学习问题)以及数据操作预备知识Ⅲ(概率)
开源项目地址:d2l-ai/d2l-zh 教材官网:https://zh.d2l.ai/ 书介绍:https://zh-v2.d2l.ai/ 笔记基于2021年7月26日发布的版本,书及代码下载地址在 ...
- 使用AWS最便宜的GPU实例 from 动手学深度学习v2 李沐大神
使用AWS最便宜的GPU实例 from 动手学深度学习v2 李沐大神 视频链接https://www.bilibili.com/video/BV1MA411L78X?t=493 由于购买的电脑没有配 ...
- 动手学深度学习 v2 视频版
动手学深度学习 v2 01 课程安排 目标 内容 形式 你将学到什么? 资源 02 深度学习介绍 AI 地图 图片分类 物体检测和分割 样式迁移 人脸合成 文字生成图片 文字生成 03 安装 本地安装 ...
- 李沐动手学深度学习v2/总结1
总结 编码过程 数据 数据预处理 模型 参数,初始化参数 超参数 损失函数,先计算损失,清空梯度(防止有累积的梯度),再对损失后向传播计算损失关于参数的梯度 优化算法,使用优化算法更新参数 训练求参数 ...
- 《动手学深度学习v2》之细致解析(1)内容及介绍及安装
前言 作者来自北京某不知名985,现在是本科在读学生,专业是数据科学与大数据技术,班上同学都太卷了,没办法,需要学习深度学习,经大佬介绍,在B站上找到了一个很不错的资源,李沐老师的<动手学深度学 ...
最新文章
- .NET中获取电脑名、IP及用户名方法
- php数据采集类,一个数据采集类
- 虚拟机在安装svn时 认证密码一直报错_研路同行|安装虚拟机到安装GAMIT教程步骤汇总...
- JDBF读取DBF文件
- select 实现server I/O多路复用通信
- Rust 1.31正式发布,首次引入Rust 2018新功能
- matlab将x排序 y随之变化,在MATLAB中:XData和YData如何用更改的行数更新?
- NYOJ --25--A Famous Music Composer
- Tableau bug合集1:无法展示emoji表情包
- 手机、PDA、车载GPS导航入门手册
- xxampp 配置php_MAC下使用XMAPP配置php环境
- HDMI 分配器正确使用方法
- it行业 平均年龄_IT行业一线员工现状调查报告
- 转动的太极纯HTML代码
- CCF ChinaSoft 2022预告丨形式化方法工业应用前沿分论坛 暨中科国创高可信联合上海控安新品发布...
- Java获取当天0时0分0秒时间的方法
- Python 使用pyinstaller打包exe文件报错: TypeError: an integer is required (got type bytes) 的解决方法
- MapGuide源码分析----MapGuide服务器源码分析
- 无懈可击的web设计
- 博睿孟曦东:致力于提升企业关键业务可靠性与稳定性使其IT质量可视化
热门文章
- maven中,xml文件无法编译,想要在Java中写xml文件,需要配置xml信息,另外springBoot设置如何在资源目录下扫描xml文件
- csv逗号分隔符转换_文件系统(02):基于SpringBoot管理Xml和CSV
- mysql数据库引擎事务_代码配置都没问题,为什么事务不回滚(了解Mysql数据库引擎)...
- python闹钟界面程序_利用QT写一个极简单的图形化Python闹钟程序
- Windows Azure Cloud Service (25) 使用Startup注册COM组件(下)
- Day2 python基础
- VUe Eelement-ui 兼容es6 兼容IE9+ 报错:SCRIPT1003: 缺少 ':’
- Ubuntu 16.04通过源码安装QUEM虚拟机
- HibernateProxy. Forgot to register a type adapter?
- SDOI2015 序列统计