机器学习基本概念简介上
机器学习:就是找一个函数,如将语音转化为文字,将图片转化为标签,而这个函数是人类很难去找到的,所以我们通过机器的力量,去找到这个函数。
深度学习(机器学习中的一个关键技术):机器要找一个函数,而这个函数是用类神经网络来找到的。
输入:向量 矩阵(如图片) 序列(如语音) 输出:数值,类别,text等
Supervised Learning (监督学习) 对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。
Unsupervised Learning (非监督学习)
缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。如 : Self-supervised Learning(自监督学习 )
Different types of functions:
Regression:the function outputs a scalar(例如预测明天PM2.5的数值) Classification:given options(classes) the function outputs the correct one(例如邮箱分类垃圾邮件,Playing GO)
Structured Learning:(输出是一个有结构的东西,如写一篇文章)
1.Function
model y=b+w*x1 based on domain knowledge
x1:已知的数据 w:weight b:bias 偏差
2.Define loss (越小越好)
loss也是一个function,输入是b,w 即 L(b,w)
输出的数值表示b w 这两个参数的好坏
用验证集得到,L=1/N Σ En
E=y-yi 绝对误差(MAE)E=(y-yi)^2 相对误差(MSE)
还有其他,loss函数由自己定义,不唯一
3.Optimization w ,b =arg min L**
选w为例
Gradient Descent(梯度下降法)
1.(Randomly)pick an initial value w (随机选一个w)2. Compute dL/dw 如果是正值,则把w变小。负值,把w变大变大变小多少(w1-w0=η*dL/dw)由两个参数决定 1.dL/dw的大小 2.η:learning rate(学习率,训练时自己设定)3.Update w iteratively(重复以上操作),在 设定的次数达到之后 或者 dL/dt=0
如果是两个参数,则同上
1.随机选择w0,b02.Compute dL/dw,dL/db (可以想象为b为y轴,w为x轴,在一个平面上移动)3.Update
参考:李宏毅《机器学习/深度学习》
机器学习基本概念简介上相关推荐
- 李宏毅2021/2022春机器学习课程(机器学习基本概念简介)
(强推)李宏毅2021/2022春机器学习课程_哔哩哔哩_bilibili 目录 1.机器学习是什么? 2.机器学习任务 2.1 regression回归问题 2.2 classification分类 ...
- 1-2 李宏毅2021春季机器学习教程-第一节(下)-深度学习基本概念简介
上篇文章1-1 李宏毅2021春季机器学习教程-第一节(上)-机器学习基本概念简介介绍了回归的一些知识,重点介绍了机器学习寻找函式的三个步骤.接着我们继续学习第一节Introduction的内容. 目 ...
- 李宏毅机器学习课程学习笔记(1)——机器学习基本概念
机器学习基本概念介绍 让机器具备寻找一个所需函数的能力--两大任务 Regression回归 回归预测 Classification分类 判断是否符合要求:True/Flase Structured ...
- Computer Science Theory for the Information Age-4: 一些机器学习算法的简介
Computer Science Theory for the Information Age-4: 一些机器学习算法的简介 一些机器学习算法的简介 本节开始,介绍<Computer Scien ...
- 进程控制概念简介 多线程上篇(三)
进程控制 进程的基本数据信息是操作系统控制管理进程的数据集合,这些信息就是用来控制进程的,此处我们说的进程控制就是进程的管理. 比如进程有状态,那么进程的创建.终止,状态的切换,这都不是进程自主进行的 ...
- 流数据机器学习平台SAMOA简介
流数据机器学习平台SAMOA简介 SAMOA (Scalable Advanced Massive Online Analysis)是由雅虎开源的流数据在线机器学习的框架.和其它绝大多数大数据处理框架 ...
- 从零开始的AI·机器学习の基本概念
从零开始的AI系列 机器学习の基本概念 从零开始的AI系列 一.机器学习の相关术语及其理解 二.机器学习の学习任务 分类 回归 聚类 特征降维与低维可视化 三.机器学习の学习范式 监督式学习 半监督式 ...
- 项目背景介绍及文件系统基本概念简介
文章目录 1 项目背景介绍 2 文件系统基本概念简介 2.1 文件系统接口 2.2 存储的基本单位 2.3 文件存储单位 2.4 文件结构 3 海量存储选用大文件结构的原因 1 项目背景介绍 根据淘宝 ...
- apache madlib 教程_Apache顶级开源项目——机器学习库MADlib简介与应用实例
原标题:Apache顶级开源项目--机器学习库MADlib简介与应用实例 Apache MADlib是Pivotal与UCBerkeley合作的一个开源机器学习库,提供了精确的数据并行实现.统计和机器 ...
- 图谱实战 | 斯坦福黄柯鑫:图机器学习在生物图上的应用
转载公众号 | DataFunSummit 分享嘉宾:黄柯鑫 斯坦福大学 博士生 编辑整理:元玉蒲 西北大学 出品平台:DataFunTalk 导读:大家好,我叫黄柯鑫.我现在是斯坦福大学的计算机科学 ...
最新文章
- 在线等!同事扔需求,不会写代码躲在厕所怎么办 | 每日趣闻
- Eclipse错误提示: Symbol 'xxxx' could not be resolved
- Linux下mysql新建账号及权限设置
- [网络安全自学篇] 二十八.文件上传入门及防御原理(一)
- **加密解密基础、PKI及SSL、创建私有CA**
- 《论文笔记》Multi-UAV Collaborative Monocular SLAM
- shell基础——变量定义
- 基于summernote的富文本编辑器,粘贴时去除word、html格式
- 墨菲定律与 IndexOutOfBoundsException(数组越界异常)
- 记录一次VM14虚拟机出问题 Oh no,something has gone wrong!
- java 造数据_java测试造数据神器JavaFaker
- 【EXLIBRIS】#小词旮旯#
- android:kotlin语言开发再也不用findViewById与ButterKnife
- 如何给单元格加斜线?
- 粉笔公考——错题集——行测
- 计算机手速如何学,拼不过手速的你,来学学这些操作
- 客户端GUI测试技术和自动化测试架构设计简谈
- WEB安全基础-文件上传
- 计算机打印中没有记录纸,打印机出来白纸没有字
- 植物大战僵尸(6):查找植物叠加种植CALL