机器学习要知道的基础概念和简单框架

  • 机器学习相关的基础概念
  • 机器学习的简单框架

机器学习相关的基础概念

All models are wrong but some are useful(所有模型都是错误的,但有些是有用的)

机器学习:简言之涉及概率论、统计学、模型算法等,就是说算法解析数据,从中学习,然后对事物做出决定或预测。

数据集:如下图所示我们所看到的数据集合。
特征:如下表中的年龄,奖金等,特征是对样本的描写。
特征向量:事物的特征组成的向量。
标签:因变量Y,即该组数据的结果描述。
属性值:下图示例中的—18,5000等则为属性值。
缺失数据:数据中为空的数据。
样本空间:训练数据中出现的属性值构成的集合空间,也叫属性空间。
假设空间:理论上所有可能的属性值构成的集合空间。
回归:预测连续型变量。
分类:预测分类型变量,且类别已知。
聚类:预测分类型变量,但类别不知。

数据集分为三份
训练集:在机器学习的过程中使用,负责学习模型,训练模型。
验证集:验证模型,调整参数优化模型。
测试集:测试模型,用于判断模型的可用程度。
(备注:也可分为两份,即训练集和测试集,分配比例0.25(0.2) / 0.75(0.2))。

机器学习的简单框架


监督学习:Supervised learning
同时具有特征(feature)和标签(label),即便是当面对没有标签的数据,机器也可通过特征判断出标签。
简单来记—一定是知道目标变量(即因变量Y)

无监督学习:Unsupervised learning
只有特征,没有标签,不知道数据与特征之间的关系,需要通过学习得到数据与特征之间的联系。
简单来记—数据中肯定没有目标变量(即因变量Y)

半监督学习:Semi-Supervised learning
数据一部分有标签,一部分没有标签。

强化学习:Reinforcement learning
也是使用没有标签的数据,通过奖惩函数得知我们与正确答案距离的远近。

机器学习基础概念及简单框架相关推荐

  1. 机器学习入门 笔记(二) 机器学习基础概念

    第二章 机器学习基础概念 1.机器的数据 2.机器学习的主要任务 3.监督学习和非监督学习 4.批量.在线学习.参数.非参数学习 5.哲学思考 6.环境的搭建 1.机器的数据 我们以鸢尾花的数据为例. ...

  2. 机器学习基础概念——过拟合和欠拟合

    欢迎关注,敬请点赞! 机器学习基础概念--过拟合和欠拟合 1. 基本概念 1.1 偏差和方差 2. 欠拟合和过拟合 2.1 学习曲线 2.2 复杂程度曲线 2.3 支持向量机的过拟合和欠拟合 2.4 ...

  3. 机器学习笔记(一)numpy的使用、机器学习基础概念

    目录 1.numpy 1.1.创建 numpy.array 1.1.1.常规创建 numpy.array 的方法 1.1.2.其他创建 numpy.array 的方法 1.1.2.其他创建随机数 ra ...

  4. [云炬python3玩转机器学习笔记] 2-1机器学习基础概念

    机器学习基础概念 一.关于数据 本文约定: 大写表示矩阵 小写表示向量 上标代表第几个样本 下标代表第几个特征 一般向量都表示为列向量 特征空间:每个维度都可以表示一个特征,形成一个空间(2D,3D, ...

  5. 机器学习——基础概念

    一. 机器学习基础概念 总结过层中,我结合了头歌上的相关公开课程:详见 (一).什么是机器学习? 机器学习致力于通过计算的手段,利用经验来改善系统的性能. "经验"-->通常 ...

  6. 关于深度学习的一些基础概念的简单梳理

    目录 独立同分布independent and identically distributed (i.i.d.) BN(Batch Normalization)批规范化 正则化 损失函数 过拟合现象 ...

  7. SOA之(2)——SOA架构基础概念与设计框架

    SOA的设计框架 设计框架与架构相关的概念紧密相连,原则.模式和架构始终是与设计共舞的. SOA服务设计的原则中记录了一个基础的设计框架: 设计特性(Design Characteristic)--由 ...

  8. 浅谈scala-API的基础概念及简单例子

    为什么学习scala 唯一的目的就是:能够看懂Spark源码; 介绍scala Scala:它不是一门新的编程语言,而是一个结合体; scala要想运行,必须安装jdk;它的编译和运行在jdk基础之上 ...

  9. 机器学习基础概念练习题与答案

    1.你会怎么定义机器学习? 答:机器学习是一门能够让系统从数据中学习的计算机科学 2.机器学习在哪些问题上表现突出,你能提出四种类型吗? 答:机器学习非常利于: 1.不存在已知算法解决方案的复杂问题2 ...

最新文章

  1. php框架打印session,Session组件
  2. 几种添加系统环境变量方法和区别
  3. 三目运算符对比三个_Javascript之if条件语句和三目运算符
  4. 如何根据对象获取到对应的表名_Excel VBA 常用对象二
  5. 使用python3.7配置开发钉钉群自定义机器人(2020年新版攻略)
  6. 在linux下磁盘挂在操作,linux下挂载磁盘操作
  7. 计算器 - 栈的应用
  8. [转载] python3 字符串比较函数_python3 字符串操作相关函数
  9. openmv探索_5_openmv读取的数据输出到外界
  10. 笔记本计算机涂硅脂,图吧小白教程 篇十一:笔记本拆机换硅脂教程(大拆)...
  11. springcloud配置nacos,实现不同的环境使用不同的配置文件,不同的开发人员使用不同的配置文件
  12. c盘是不是越大越好_C盘分区并非越大越好
  13. Adobe Bridge使用教程:BR键盘快捷键大全
  14. 合唱队形java_合唱队形
  15. win10 休眠不读u盘_win10电脑不读u盘如何修复
  16. loadlibrary failed with error 126:找不到指定模块 解决方法
  17. reset.css(常用项目代码初始化)
  18. 解决PHP项目显示“该网页无法正常运作”,但没有显示报错内容
  19. SqlServer-IN写法(普通、存储过程)
  20. 查看VS中一些默认环境变量设置的路径

热门文章

  1. 小米 max android,小米Max原生安卓8.0刷机包放出:仅供尝鲜体验
  2. 年轻人为什么一定要理财?
  3. 仿腾讯新闻客户端图片新闻幻灯片动画效果
  4. MongoDB深究之ObjectId
  5. 『.NET Tools』在.Net Core中实现汉字转拼音
  6. 一份从0到1的Java项目实践清单,看这篇就对了!
  7. mac读写NTFS格式移动硬盘
  8. Java并发基础理论
  9. 解决阿里云oss文件上传部分MP4格式视频文件上传导致上传崩溃问题
  10. 叭叭日记918第二天