由现实世界引出“机器学习”

看到乌云密布,自己推测出要下雨

通过一个苹果的表面和大小,来判断这个苹果是否好吃

我们通过经验来进行判断,这是因为我们积累了许多有用的经验,通过对有用经验的分析,就能对遇到的情况做出相应的对策。

计算机中,经验就是“数据”判断模型就是“算法”机器学习就是研究“学习算法”

举例:当计算机数据库有上千万只猫的照片,并对其特点进行建模分析,你给机器一张照片,它就能进行判断这张照片的动物是不是猫。(有人问:会不会出错?肯定会出错啊!模型如果100%就不会出错,这是依赖于“算法”的好坏和数据库的大小。我们人类的经验也有时候会出错,这其实就是概率的问题)

基本概念:从具体到抽象

要进行机器学习,首先要准备数据。还是以猫为例:

{猫颜色:黑的、白的、黄的...}、{猫眼睛:颜色一样的,颜色不一样} 、{猫有的有铃铛,有的没有铃铛}   这些都是“特征”、“属性”,每一只猫的属性有很多种,我们可以用一只黑色+眼睛颜色一样+没有铃铛的猫来进行描述。

比如现在有100只猫的照片,那么这个就称为“样本空间”

这100只猫的属性集合,分开形成各自的集合,比如上面3个集合,那就称为“属性空间

抽象:D={x1,x2,x3.....xm}表示有m个示例的数据集。(100只猫的照片形成的数据集)

每个x都有d个属性描述(每只猫可以由:颜色+眼睛色彩+铃铛等属性区分),d是维数

x是样本空间的一个向量

从数据中学习得的模型称为“学习”或者“训练”

每一个样本(每一张猫的照片)称为一个“训练样本”,训练样本的集合为“训练集

潜在的规律称为“假设”,也称为“真相”、“真实”,学习过程就是不断找到真相。

仅仅有前面示例的猫的照片也不够,需要建立联系,就是告诉计算机这是不是猫,(白色,双眼一样,有铃铛;这只是猫)注意分号!这是一个“标记”,拥有了标记,这就成为了一个“样例”这样的集合成为“标记空间”“输出空间”


给你一张照片,判断是不是猫,这个叫做“分类”,预测是连续值,称为“回归

只涉及两个类别的分类成为“二分类”问题: “正类”+“反类”;多个分类成为:“多分类”

预测的过程称为:“测试”;测试的东西称为:“测试样本

同时可以对其进行聚类分析:比如把猫分为:橘猫,波斯猫....聚类分析有利于进一步学习,找到潜在规律,这些规律我们事先并不知道。

根据训练数据是否有标记:“监督学习”+“无监督学习
监督学习代表:分类和回归;无监督学习代表:聚类

训练的目的是解决未知情况,对于“新样本”的认识能力,也就是“泛化”能力

假设样本空间服从一个未知分布,每个样本都是独立的,“独立同分布”,一般而言,训练样本越多,这个未知分布越明确,越实用,泛化能力也越强!

到底什么是“机器学习”?机器学习有哪些基本概念?(简单易懂)相关推荐

  1. 机器学习经典算法决策树原理详解(简单易懂)

    ↑ 点击上方[计算机视觉联盟]关注我们 最经典的决策树算法有ID3.C4.5.CART,其中ID3算法是最早被提出的,它可以处理离散属性样本的分类,C4.5和CART算法则可以处理更加复杂的分类问题, ...

  2. 机器学习入门:重要的概念---信息熵(Shannon’s Entropy Model)

    机器学习入门:重要的概念---信息熵(Shannon's Entropy Model) 个人公众号:follow_bobo 在机器学习里面,信息熵(Shannon's Entropy Model)其实 ...

  3. 我爱机器学习 机器学习干货站- 资源

    我爱机器学习 机器学习干货站 跳至正文 机器学习 Deep Learning 所有主题 关注我们 DeepMind团队的<Deep Reinforcement Learning in Large ...

  4. 我爱机器学习--机器学习方向资料汇总

    转载:http://blog.csdn.net/shuimanting520/article/details/45748505 机器学习爱好者资料 机器学习领域的几种主要学习方式 From Stump ...

  5. 吐血整理:机器学习的30个基本概念,都在这里了(手绘图解)

    01 空间表征 在学习深奥的机器学习理论之前,首先来介绍一些机器学习中最基本的概念. 特征(Feature):一个具体事物的属性描述,由属性向量表示.第j个记录xj的属性向量可以表示为: xj=(xj ...

  6. 机器学习排序之Learning to Rank简单介绍

     机器学习排序之Learning to Rank简单介绍 标签: Learning to Rank学习排序PointwisePairwiseListwise 2015-01-03 21:50 23 ...

  7. 统计机器学习(机器学习) 概念

    统计机器学习(机器学习) 概念 该文章是作者阅读相关书籍和资料后,总结和归纳的一些个人认为有必要整理和了解的知识点介绍.与大家一起分享,如有不妥之处,还望指正. 统计(机器)学习 1.统计学习概念 统 ...

  8. 机器学习原来如此有趣!全世界最简单的机器学习入门指南

    机器学习原来如此有趣!全世界最简单的机器学习入门指南更多关于机器学习的实战案例 你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢?你是否已经厌倦了在和同事对话时只能点头呢?现在,让 ...

  9. 03.PyTorch与CNN(4-1 机器学习和神经网络的基本概念(1))

    03.PyTorch与CNN(4-1 机器学习和神经网络的基本概念(1)) 一, 4-1 机器学习和神经网络的基本概念(1) 来自慕课网 一, 4-1 机器学习和神经网络的基本概念(1)

  10. 机器学习模型评价指标及拟合概念

    机器学习模型评价指标及拟合概念 一.机器学习模型评价指标 回归问题等连续值的差值的判断 1) MAE平均绝对误差: 2)MSE均方误差: 3)RMSE均方根误差: 4)R平方: 分类问题 1)混淆矩阵 ...

最新文章

  1. Access数据库审计工具mdbtools
  2. Java网络编程从入门到精通(14):多种多样的建立网络连接的方式
  3. java线程通信概念_java基础线程总结(线程概念、线程创建方式、线程间通信、线程重要方法)...
  4. 题目:三个售票员 卖出 30张票 || 多线程编程的企业级套路+模板||synchronized与Lock的区别
  5. 推出了底层代码chatbot开发工具,Rulai获650万美元融资
  6. .NET 实现并行的几种方式(三)
  7. php实现git服务器,如何搭建和配置Git服务器
  8. 计算机网络基础大学教材,《计算机网络技术及应用——大学计算机基础教育规划教材》低价购书_教材教辅考试_孔网...
  9. 国内五大主流网站内容抓取工具/采集软件大盘点
  10. 2021-07-21淘宝网第二次尝试
  11. 基于opencv库把图像灰度化,二值化
  12. Java 实现 POS 打印机无驱打印
  13. 虚拟机ubuntu的联网方法(NET)
  14. wave文件(*.wav)格式、PCM数据格式, goldwave 可以播放pcm raw audio
  15. jquery局部打印插件使用
  16. 叮咚,您有一封告白信件待查收(原生HTML+CSS+JS绘制表白信件,代码+链接+步骤详解)
  17. python金融数据分析及可视化
  18. MCE公司:PROTAC 技术靶向降解 BTK
  19. 【Shader进阶】SubShader块标签Tags——IgnoreProjector
  20. 由VC2010与VC2017数据结构差异造成的程序错误

热门文章

  1. python性能测试模块_技巧python模块性能测试-阿里云开发者社区
  2. 慕课python第六周测验答案_中国大学慕课答案第八单元测试答案_Python语言程序设计考试测验答案...
  3. 远端WWW服务支持TRACE请求漏洞修复(linux)
  4. 简述数据在OSI参考模型中的流动过程及过程中数据的单位
  5. 计算机按照数据处理规模大小可分为,计算机按照数据处理规模大小可以分为巨型计算机、、、。...
  6. oracle输出一天所有秒数,Oracle函数通过秒数或分钟数获取时间段
  7. mybatis多个foreach_MyBatis中使用foreach完成复杂查询
  8. C#调用存储过程详解
  9. POJ2104 K-th number 函数式线段树
  10. 还在用ViT的16x16 Patch分割方法吗?中科院自动化所提出Deformable Patch-based方法,涨点显著!...