1. 训练误差和泛化误差

  • 训练误差:模型在训练数据上的误差(比如:模拟高考,可以有很多次)
  • 泛化误差:模型在新数据上的误差(比如:真实高考,只有一次)




K-则交叉验证


2. 过拟合和欠拟合

模型容量:模型的复杂度
简单数据集:比如线性模型的数据,比如ax+b=y
复杂数据集举例:ImageNet



2.1 VC 维

  • 统计学习理论的一个核心思想
  • 对于一个分类模型,VC等于一个最大的数据集的大小,不管如何给定标号,都存在一个模型来对它进行完美分类。




3. 代码样例 过拟合 欠拟合








4. QA

  1. SVM很难训练100万的数据量,SVM可以调的参数很少,特征的分类,提取是分开处理的;神经网络GPT 3 训练的参数都超过1750亿个。神经网络是个语言,可以做很灵活编程。
  2. k则交叉验证,在神经网络上用的比较少,因为数据集都比较大。k则交叉验证应用于数据比较少的情况,k的选择原则,在于能接受的计算量的情况下。
  3. 深度学习 打败 svm ,因为效果很好,比如图片识别的精度很高,但是深度学习可解释性不好。svm 打败 多层感知机,因为svm有理论证明,并且容易调参,并且可调参数很少,比较简单。
  4. VC维衡量模型,简单来说是可以记住的数的维度,比如能备注π的100位小数,就是100VC维。
  5. 科学、工程、艺术:神经网络有一部分是艺术,可解释性不强,靠猜测。

参考

https://www.bilibili.com/video/BV1kX4y1g7jp?p=1

模型选择 + 过拟合和欠拟合 动手学深度学习v2 pytorch相关推荐

  1. 含并行连结的网络 GoogLeNet / Inception V3 动手学深度学习v2 pytorch

    1. 含并行连结的网络 GoogLeNet 第一个神经网络可以做到超过100层. Inception 块的名字,取自盗梦空间,就是不断深入到梦境中,不断深入. Inception 使得参数减少,计算量 ...

  2. 【动手学深度学习v2李沐】学习笔记07:权重衰退、正则化

    前文回顾:模型选择.欠拟合和过拟合 文章目录 一.权重衰退 1.1 硬性限制 1.2 柔性限制(正则化) 1.3 参数更新法则 1.4 总结 二.代码实现 2.1 从零开始实现 2.1.1 人工数据集 ...

  3. (d2l-ai/d2l-zh)《动手学深度学习》pytorch 笔记(2)前言(介绍各种机器学习问题)以及数据操作预备知识Ⅰ

    开源项目地址:d2l-ai/d2l-zh 教材官网:https://zh.d2l.ai/ 书介绍:https://zh-v2.d2l.ai/ 笔记基于2021年7月26日发布的版本,书及代码下载地址在 ...

  4. (d2l-ai/d2l-zh)《动手学深度学习》pytorch 笔记(4)线性神经网络(暂停)

    开源项目地址:d2l-ai/d2l-zh 教材官网:https://zh.d2l.ai/ 书介绍:https://zh-v2.d2l.ai/ 笔记基于2021年7月26日发布的版本,书及代码下载地址在 ...

  5. 动手学深度学习v2 p1引言 监督学习与无监督学习

    1.引言 1.2. 机器学习中的关键组件 首先介绍一些核心组件.无论什么类型的机器学习问题,都会遇到这些组件: 可以用来学习的数据(data): 如何转换数据的模型(model): 一个目标函数(ob ...

  6. (d2l-ai/d2l-zh)《动手学深度学习》pytorch 笔记(3)前言(介绍各种机器学习问题)以及数据操作预备知识Ⅲ(概率)

    开源项目地址:d2l-ai/d2l-zh 教材官网:https://zh.d2l.ai/ 书介绍:https://zh-v2.d2l.ai/ 笔记基于2021年7月26日发布的版本,书及代码下载地址在 ...

  7. 使用AWS最便宜的GPU实例  from 动手学深度学习v2 李沐大神

    使用AWS最便宜的GPU实例  from 动手学深度学习v2 李沐大神 视频链接https://www.bilibili.com/video/BV1MA411L78X?t=493 由于购买的电脑没有配 ...

  8. 动手学深度学习 v2 视频版

    动手学深度学习 v2 01 课程安排 目标 内容 形式 你将学到什么? 资源 02 深度学习介绍 AI 地图 图片分类 物体检测和分割 样式迁移 人脸合成 文字生成图片 文字生成 03 安装 本地安装 ...

  9. 李沐动手学深度学习v2/总结1

    总结 编码过程 数据 数据预处理 模型 参数,初始化参数 超参数 损失函数,先计算损失,清空梯度(防止有累积的梯度),再对损失后向传播计算损失关于参数的梯度 优化算法,使用优化算法更新参数 训练求参数 ...

  10. 《动手学深度学习v2》之细致解析(1)内容及介绍及安装

    前言 作者来自北京某不知名985,现在是本科在读学生,专业是数据科学与大数据技术,班上同学都太卷了,没办法,需要学习深度学习,经大佬介绍,在B站上找到了一个很不错的资源,李沐老师的<动手学深度学 ...

最新文章

  1. .NET中获取电脑名、IP及用户名方法
  2. php数据采集类,一个数据采集类
  3. 虚拟机在安装svn时 认证密码一直报错_研路同行|安装虚拟机到安装GAMIT教程步骤汇总...
  4. JDBF读取DBF文件
  5. select 实现server I/O多路复用通信
  6. Rust 1.31正式发布,首次引入Rust 2018新功能
  7. matlab将x排序 y随之变化,在MATLAB中:XData和YData如何用更改的行数更新?
  8. NYOJ --25--A Famous Music Composer
  9. Tableau bug合集1:无法展示emoji表情包
  10. 手机、PDA、车载GPS导航入门手册
  11. xxampp 配置php_MAC下使用XMAPP配置php环境
  12. HDMI 分配器正确使用方法
  13. it行业 平均年龄_IT行业一线员工现状调查报告
  14. 转动的太极纯HTML代码
  15. CCF ChinaSoft 2022预告丨形式化方法工业应用前沿分论坛 暨中科国创高可信联合上海控安新品发布...
  16. Java获取当天0时0分0秒时间的方法
  17. Python 使用pyinstaller打包exe文件报错: TypeError: an integer is required (got type bytes) 的解决方法
  18. MapGuide源码分析----MapGuide服务器源码分析
  19. 无懈可击的web设计
  20. 博睿孟曦东:致力于提升企业关键业务可靠性与稳定性使其IT质量可视化

热门文章

  1. maven中,xml文件无法编译,想要在Java中写xml文件,需要配置xml信息,另外springBoot设置如何在资源目录下扫描xml文件
  2. csv逗号分隔符转换_文件系统(02):基于SpringBoot管理Xml和CSV
  3. mysql数据库引擎事务_代码配置都没问题,为什么事务不回滚(了解Mysql数据库引擎)...
  4. python闹钟界面程序_利用QT写一个极简单的图形化Python闹钟程序
  5. Windows Azure Cloud Service (25) 使用Startup注册COM组件(下)
  6. Day2 python基础
  7. VUe Eelement-ui 兼容es6 兼容IE9+ 报错:SCRIPT1003: 缺少 ':’
  8. Ubuntu 16.04通过源码安装QUEM虚拟机
  9. HibernateProxy. Forgot to register a type adapter?
  10. SDOI2015 序列统计