KNN

  • 定义
    通过计算待分类数据点,与已有数据集中的所有数据点的距离。取距离最小的前k个点,根据“少数服从多数”的原则,将这个数据点划分为出现次数最多的那个类别。

  • sklearn参数说明

    使用方式:sklearn.neighbors.KNeighborsClassifier
    主要参数:

    • n_neighbors: 用于指定分类器中K的大小(默认为5)
    • weights:设置选中的K个点对分类器结果影响的权重(默认值为uniform ,也可以传入自己编写的权值计算函数)
    • algorithm:设置用于计算临近点的方法。由于当数据量很大的情况下计算当前点和所有点的距离,再选出最近的k个点,这个过程的计算量非常耗时,所以algorithm选项中提供了==ball_tree==、==kd_tree==、 ==brute== 算法,它们代表不同的寻找邻居的优化算法,默认值为auto(会根据训练数据自动选择)
  • KNN实例使用

from sklearn.neighbors import KNeighborsClassifier#step1:创建数据
x=[[0],[1],[2],[3]]  #创建数据
y=[0,0,1,1]          #创建数据对应标签#step2:设置参数并训练分类器
neigh=KNeighborsClassifier(n_neigbors=3) #设置邻居数为3
neigh.fit(x,y) #调用fit()进行训练#step3:测试训练好的knn分类器效果
#输入未知样本[1.2],利用KNN进行分类
print(neigh.predict([[1.1]])) #调用predict函数进行预测,输入为数组格式
  • 关于K的取值
  • K如果较大,可以减少估计误差,但是距离较远的样本也会对预测起作用,导致预测错误
  • K如果较小,相当于使用较小的领域进行预测,如果邻居恰好是噪声点会导致过拟合
  • 所以,K会倾向于选择较小的值,并使用交叉验证法选取最优K值

python机器学习应用mooc_(1)KNN相关推荐

  1. Python 机器学习大作业 用knn算法对adult数据集进行50w年薪收入预测

    数据分析与机器学习--收入分类 摘 要 今天,人工智能AI已经融入了人类的生活,基本上在生活中能接触到的领域,都有人工智能的身影.而说起人工智能就必定会想到机器学习ML,它以某种方式几乎影响了每个行业 ...

  2. Python 机器学习简单实例:KNN预测鸢尾花分类

    读研太忙了才发现一年没更新,就以当初学习机器学习的一个简单例子作为一个新的开始吧.以下为正文. 一.安装sklearn库 执行以下命令安装, 注意:在此之前需要提前安装numpy.matplotlib ...

  3. 用 Python 手写机器学习最简单的 KNN 算法

    作者 | 苏克1900 责编 | 胡巍巍 说实话,相比爬虫,掌握机器学习更实用竞争力也更强些. 目前网上大多这类教程对新手都不友好,要么直接调用 Sklearn 包,要么满篇抽象枯燥的算法公式文字,看 ...

  4. Python 手写机器学习最简单的 kNN 算法

    https://www.toutiao.com/a6698919092876739079/ Python 手写机器学习最简单的 kNN 算法 苏克1900 Python爬虫与数据挖掘 本文 3000 ...

  5. Python机器学习实验二:1.编写代码,实现对iris数据集的KNN算法分类及预测

    Python机器学习实验二:编写代码,实现对iris数据集的KNN算法分类及预测 1.编写代码,实现对iris数据集的KNN算法分类及预测,要求: (1)数据集划分为测试集占20%: (2)n_nei ...

  6. 教你用OpenCV实现机器学习最简单的k-NN算法

    前言:OpenCV 的构建是为了提供计算机视觉的通用基础接口,现在已经成为经典和最优秀的计算机视觉和机器学习的综合算法工具集.作为一个开源项目,研究者.商业用户和政府部门都可以轻松利用和修改现成的代码 ...

  7. 【转】Python机器学习库

    2019独角兽企业重金招聘Python工程师标准>>> Python 在科学计算领域,有两个重要的扩展模块:Numpy和Scipy.其中Numpy是一个用python实现的科学计算包 ...

  8. Python 机器学习库 Top 10,你值得拥有!

    随着人工智能技术的发展与普及,Python 超越了许多其他编程语言,成为了机器学习领域中最热门最常用的编程语言之一.有许多原因致使 Python 在众多开发者中如此受追捧,其中之一便是其拥有大量的与机 ...

  9. windows环境下python怎么安装mlxtend-python连接QQ实现自动回复python 机器学习库

    擅长:神经网络 网址:http://deeplearning.net/software/pylearn2/ Github:http://github.com/lisa-lab/pylearn2 Pye ...

  10. Python机器学习笔记:sklearn库的学习

    自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了,scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法.还包括了特征提取,数据 ...

最新文章

  1. 再加力度!浙江抢人!博士补120万,硕士补70万,本科补20万
  2. idea里maven设置本地仓库报错原因
  3. splice方法_JavaScript数组常用方法
  4. 普通卷积armv7-neon指令集实现—XNNPACK
  5. redis应用之——关注、被关注
  6. 关于MFC自动生成的各个类的指针访问
  7. 数据结构和算法分析(三)——C++实现队列
  8. jenkins执行本地/远程shell脚本
  9. 2018年湖南居民人均可支配收入25241元 出行餐饮成消费热点
  10. 万稞pw80线切割编程软件_Sodick 沙迪克慢走丝线切割机床,工件摆斜不校边加工步骤...
  11. Java拦截器和过滤器的作用和区别
  12. user-modify
  13. ngnix 端口映射
  14. 自动注册11平台账号
  15. Java前方交会后方交会编程_单像空间后方交会和双像解析空间后方-前方交会的算法程序实现.doc...
  16. 利用Python+云服务器+邮箱实现的个人待办事项提醒
  17. hdwiki上传附件不显示bug解决办法
  18. 写给二线城市【Python工程师】的成长指南
  19. 魔金(5)——手雷、爱神锁、牛头扣
  20. 基于闪电搜索算法的函数寻优算法

热门文章

  1. plc算法相关论文参考
  2. 5.2.3 配置SQL Server代理
  3. mac下如何把本地项目上传到Github
  4. PUT 还是 POST ?
  5. HTML固定的底栏(flex布局)
  6. STC学习:八位数码管+流水灯
  7. hurst指数matlab代码_Matlab 简介
  8. h5保存图片到手机_如何快速制作一个【H5】作品?
  9. C++:stack.pop() error: cannot initialize a variable of type ‘char‘ with an rvalue of type ‘void‘
  10. android文件存储的有点,快速理解Android文件存储路径