K 近邻的数学表达

所谓 K 近邻的数学表达,也即统计计数(再进行表决)的数学表达。

y=argmaxcj∑xi∈Nk(x)I(yi=cj),i=1,2,…,N;j=1,2,…,K

y=\arg\max_{c_j}\sum_{x_i\in N_k(x)}I(y_i=c_j),\quad i=1,2,\ldots,N;\;j=1,2,\ldots,K

k 值的选择

k 值的选择会对 k 近邻法的结果产生重大影响。

如果选择较小的 k 值,就相当于用较小的邻域中的训练实例(xi∈Nk(x)x_i\in N_k(x))进行预测。“学习”的近似误差(approximation error)会减少,只有与输入实例较近的(相似的)训练实例才会对预测结果起作用,但缺点是“学习”的估计误差(estimation error)会增大,预测结果对近邻的实例点非常敏感。如果近邻的实例点恰巧是噪声,预测就会出错。换句话说,k 值的减小就意味着模型变得复杂,容易发生过拟合。

如果选择较大的 k 值,将相当于用较大邻域中的训练实例进行预测。其优点是可以减少学习的估计误差,但会增大学习的近似误差。这时与输入实例较远的(不相似)的训练实例也会对预测起作用,使预测发生错误。k 值的增大意味着整体的模型变得简单。

如果 k=Nk=N,那么无论输入实例是什么,都将简单地预测它属于在训练实例中出现最多的类,这时,模型过于简单,完全忽视训练实例中的大量有用信息。

在应用中,k 一般取一个较小的值,通常采用交叉验证法来选取最优的 k 值。

#

机器学习基础(四十一)—— KNN相关推荐

  1. 机器学习基础(十一)—— Logistic Regression 梯度更新公式的推导

    Logistic Regression 所要最佳化的问题是: minw1N∑n=1Nln(1+exp(−ynwTxn))Ein( ...

  2. KNN算法的机器学习基础

    KNN算法的机器学习基础 https://mp.weixin.qq.com/s/985Ym3LjFLdkmqbytIqpJQ 本文原标题 : Machine Learning Basics with ...

  3. [Python从零到壹] 四十一.图像处理基础篇之图像采样处理

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  4. OpenCV学习笔记(四十一)——再看基础数据结构core OpenCV学习笔记(四十二)——Mat数据操作之普通青年、文艺青年、暴力青年 OpenCV学习笔记(四十三)——存取像素值操作汇总co

    OpenCV学习笔记(四十一)--再看基础数据结构core 记得我在OpenCV学习笔记(四)--新版本的数据结构core里面讲过新版本的数据结构了,可是我再看这部分的时候,我发现我当时实在是看得太马 ...

  5. 计算机视觉面试宝典--深度学习机器学习基础篇(四)

    计算机视觉面试宝典–深度学习机器学习基础篇(四) 本篇主要包含SVM支持向量机.K-Means均值以及机器学习相关常考内容等相关面试经验. SVM-支持向量机 支持向量机(support vector ...

  6. 机器学习基础篇(十一)——主成分分析法

    机器学习基础篇(十一)--主成分分析法 一.简介 当我们对含有多个变量的数据进行观测时,我们会收集大量的数据然后分析他们.大样本的数据集固然提供了丰富的信息,但是在一定程度上增加了问题的复杂性. 如果 ...

  7. 【机器学习基础】(四):通俗理解支持向量机SVM及代码实践

    上一篇文章我们介绍了使用逻辑回归来处理分类问题,本文我们讲一个更强大的分类模型.本文依旧侧重代码实践,你会发现我们解决问题的手段越来越丰富,问题处理起来越来越简单. 支持向量机(Support Vec ...

  8. 【零基础学Java】—哈希值(四十一)

    [零基础学Java]-哈希值(四十一) 一. HashSet集合的介绍 java.util.Set接口 extends Collection接口 Set接口的特点: 不允许重复的元素 没有索引,没有带 ...

  9. 机器学习(四):CART分类树(基础篇)

    机器学习(四):CART分类树(基础篇) 相关的决策树文章: 机器学习(四)ID3决策树 机器学习(四)C4.5决策树 机器学习(四)CART回归树 机器学习(四)决策树绘图 机器学习(四)剪枝技术 ...

  10. 机器学习(四):剪枝技术(基础篇)

    机器学习(四):剪枝技术(基础篇) 相关的决策树文章: 机器学习(四)ID3决策树 机器学习(四)C4.5决策树 机器学习(四)CART分类树 机器学习(四)CART回归树 机器学习(四)决策树绘图 ...

最新文章

  1. wordpress rest api 登录_WordPress版微信小程序3.5版发布
  2. SAP SD-如何控制定价折扣的总额度
  3. 深度学习分布式策略优化、显存优化、通信优化、编译优化综述
  4. 用Kotlin开发您的第一个应用程序| Android与Kotlin
  5. windows 停止nginx
  6. Mac音量微调技巧:如何一点一点的加音量或者减呢?
  7. redis问题及答案
  8. 中职计算机专业教程购买渠道,中职计算机论文精选
  9. 电视制式及声音制式的划分
  10. php计算众数,C++算法代码——众数
  11. lighttpd 配置 ssl证书
  12. python下标访问字典的指_python字典下标
  13. 机器学习-朴素贝叶斯(基础讲解+代码实现+图像展示)
  14. 用Python绘制皮卡丘
  15. 同步压缩变变时频分析和盲源分离
  16. golang力扣leetcode 1823.找出游戏的获胜者
  17. border-radius 使用技巧
  18. matlab不连接internet激活_MATLAB R2019b 完整激活教程
  19. 【2021.11综合方案】Ubuntu + 高通QCA6174无线网卡连接不上WIFI问题解决
  20. 微信公众号接入第三方平台

热门文章

  1. MySQL的存储过程优缺点
  2. Mysql对数据库操作的简单命令
  3. android人脸识别demo_C#开发实录:基于免费SDK实现人脸识别应用开发
  4. 各种存储分配算法java代码实现_Java实现操作系统中四种动态内存分配算法:BF+NF+WF+FF...
  5. nginx过滤post请求头_Nginx Header,实现对HTTP/S请求、响应进行添加、修改、删除等操作...
  6. python 中decorator和property
  7. Linux 高阶命令进阶(一)
  8. LoadRunner中的参数与变量-产生20位的随机数
  9. Android WebView无法播放视频或直播,关闭界面后任在播放的问题;
  10. Mysql实战之高可用HMA