最近邻学习基础知识

根据分类的定义可知:分类包含两个阶段:训练阶段和工作阶段。

积极学习

到目前为止,我们前面介绍的所有机器学习技术都有显式的训练过程,都是在训练阶段就对训练样本进行学习处理,构建起分类模型,这类机器学习技术统称为“积极学习” (eager learning)。

消极学习

这一章我们将要介绍的最近邻学习,没有显式的训练过程,在训练阶段只是把训练样本保存起来,建模工作延迟到工作阶段才进行处理,这类机器学习技术统称为“消极学习”(lazy learning)

最近邻学习

最近邻学习不是在整个样本空间上一次性地估计目标函数,而是针对每个待测样本作出局部的目标函数逼近。当目标函数很复杂,但它可以用不太复杂的局部函数来逼近时,这样做有非常明显的优势。
最近邻学习可以为不同的待测样本构建起不同的目标函数逼近,因此相比于那些积极的学习技术,最近邻学习往往具有较高的分类性能。

最近邻学习基本思想


其实就是找到离待测样本最接近的k个样本,并统计他们的label,比如投票,哪个票数多就选哪个label作为样本的label。

最近邻学习常见问题

近邻索引为题




在决策树的叶子结点上进行K-近邻索引

维度灾害问题


两种解决办法,属性加权和属性选择

邻域大小问题

后验概率问题

计算效率问题

归纳偏置问题


对不同属性增加权值来实现。

最近邻算法的改进——距离加权

机器学习08:最近邻学习相关推荐

  1. 干货丨机器学习和深度学习概念入门

    对于很多初入学习人工智能的学习者来说,对人工智能.机器学习.深度学习的概念和区别还不是很了解,有可能你每天都能听到这个概念,也经常提这个概念,但是你真的懂它们之间的关系吗?那么接下来就给大家从概念和特 ...

  2. k均值例子 数据挖掘_人工智能、数据挖掘、机器学习和深度学习的关系

    一.人工智能 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器. 实际应用比如:机器视觉,指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识 ...

  3. 终于有人把自然语言处理、机器学习、深度学习和AI讲明白了

    导读:本文将带你了解自然语言处理的概念.应用,以及与机器学习.深度学习和人工智能之间的关系. 作者:卡蒂克·雷迪·博卡(Karthiek Reddy Bokka).舒班吉·霍拉(Shubhangi H ...

  4. python系列文章(基础,应用,后端,运维,自动化测试,爬虫,数据分析,可视化,机器学习,深度学习系列内容)

    python基础教程 python基础系列教程--Python的安装与测试:python解释器.PyDev编辑器.pycharm编译器 python基础系列教程--Python库的安装与卸载 pyth ...

  5. 机器学习和深度学习引用量最高的20篇论文(2014-2017)

    转载自: https://blog.csdn.net/hll174/article/details/69808435 机器学习和深度学习的研究进展正深刻变革着人类的技术,本文列出了自 2014 年以来 ...

  6. 机器学习,深度学习相关介绍

    最近看了周志华老师的书,主要内容如下,涉及到很多机器学习的知识点: by [2017.12.29 更新  denny  shenzhen 59888745@qq.com] 1.线性模型: 线性回归:多 ...

  7. 基于机器学习与深度学习的金融风控贷款违约预测

    基于机器学习与深度学习的金融风控贷款违约预测 目录 一.赛题分析 1. 任务分析 2. 数据属性 3. 评价指标 4. 问题归类 5. 整体思路 二.数据可视化分析 1. 总体数据分析 2. 数值型数 ...

  8. 用于Java开发机器学习和深度学习的Vector API(翻译)

    本文介绍了用于Java开发机器学习和深度学习的Vector API 英语原文链接 https://software.intel.com/en-us/articles/vector-api-develo ...

  9. 机器学习、深度学习面试知识点汇总

    作者丨Oldpan 来源丨oldpan博客 编辑丨极市平台 导读 本文总结了一些秋招面试中会遇到的问题和一些重要的知识点,适合面试前突击和巩固基础知识. 前言 最近这段时间正临秋招,这篇文章是老潘在那 ...

最新文章

  1. 深度置信网络_人工智能深度学习之父Hinton深度置信网络北大最新演讲(含PPT)...
  2. 直接引用arXiv论文不规范?试试这个小工具,秒变正式发表链接,上交大校友开发...
  3. 「后端小伙伴来学前端了」Vue中 this.$set的用法 | 可用于修改对象中数组的某一个对象、 可用于更新数据到视图
  4. 视觉特征--ORB系列
  5. Linux中磁盘还有空间,但创建文件时提示空间不足
  6. linux在当前目录下创建pic目录,在Linux上创建.SO文件而不使用PIC(与位置无关的代码)(x86 32位)...
  7. Linux Hackers/Suspicious Account Detection
  8. 标准气压高度与修正海平面气压的区别
  9. 原版98启动盘镜像.img_【教程】利用Windows 10 官方下载工具下载最新系统镜像、制作启动盘...
  10. 手机和工业计算机运算能力对比,手机CPU和电脑CPU性能相差多少 手机CPU和电脑CPU性能对比...
  11. ERROR [com.alibaba.druid.pool.DruidDataSource] - abandon connection
  12. 大健康、医疗服务、商城系统、内容管理、健康数据统计、医疗问诊、慢病管理、科室管理、问诊订单、看病、挂号预约、体检订单、疾病管理、血压、血糖、运动、睡眠、物流、体温、体重、计步、心率、医院、医生、售后
  13. 入手评测华为nova10和vivoS15pro选哪个
  14. 独立站选杂货爆品站还是精耕垂直站?
  15. 卷积神经网络(conv2d参数含义、卷积层、池化层)
  16. 报错:The media could not be loaded, either because the server or network failed or ...
  17. 【方案开发】电子血压计方案开发设计
  18. Runtime error go fuck yourself
  19. python flash_Python Flask使用flash()方法
  20. 三、GNSS两种基本定位原理(1)

热门文章

  1. cakephp视图用php文件,CakePHP的视图
  2. [Cocos Creator] 制作简版消消乐(三):实现方块的生成与交换
  3. 奸商如何修改电脑属性里显示的CPU型号和内存容量
  4. 视频教程-2019年人工智能热门案例精讲之P图美化照片-深度学习
  5. 计算机毕业设计Java校园闲置物品交易平台(系统+源码+mysql数据库+lw文档)
  6. 学军OJ题解——1179 约会
  7. Google前员工创办社交推荐引擎Stamped,已获A轮投资
  8. bzoj4399 魔法少女LJJ 线段树合并
  9. 代码随想录30——回溯:332重新安排行程、51N皇后、37解数独
  10. Django教程:第一个Django应用程序(1部分)