K近邻

假设我们有一些携带分类标记的训练样本,分布于特征空间中,对于一个待分类的测试样本点,未知其类别,按照‘近朱者赤近墨者黑’,我们需要寻找与这个待分类的样本在特征空间中距离最近的k个已标记样本作为参考,帮助我们最初分类决策。

#从sklearn.datasets导入iris数据加载器

from sklearn.datasets import load_iris

iris=load_iris()

print(iris.data.shape)#(150, 4)

#查看数据说明

print(iris.DESCR)

#对iris数据集进行分割

from sklearn.cross_validation import train_test_split

#随机采样25%的数据用于测试,剩下的75%用于构建训练集合

X_train,X_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.25,random_state=33)

#使用k近邻分类器对iris数据进行类别预测

#从sklearn.preprocessing里导入StandardScaler数据标准化模块

from sklearn.preprocessing import StandardScaler

from sklearn.neighbors import KNeighborsClassifier

ss=StandardScaler()

X_train=ss.fit_transform(X_train)

X_test=ss.fit_transform(X_test)

knc=KNeighborsClassifier()

knc.fit(X_train,y_train)

y_predict=knc.predict(X_test)

print('The Accuracy of K-Nearest Neighbor Classifier is',knc.score(X_test,y_test))

#从sklearn.metrics里导入classification_report模块

from sklearn.metrics import classification_report

print(classification_report(y_test,y_predict,target_names=iris.target_names))

转载于:https://www.cnblogs.com/yxllfl/p/10561635.html

Python机器学习(基础篇---监督学习(k近邻))相关推荐

  1. Python机器学习基础篇二《监督学习》

    前言 前期回顾: Python机器学习基础篇一<为什么用Python进行机器学习> 前面说过,监督学习是最常用也是最成功的机器学习类型之一.本章将会详细介绍监督学 习,并解释几种常用的监督 ...

  2. Python机器学习基础篇三《无监督学习与预处理》

    前言 前期回顾: Python机器学习基础篇二<为什么用Python进行机器学习> 上面这篇里面写了文本和序列相关. 我们要讨论的第二种机器学习算法是无监督学习算法.无监督学习包括没有已知 ...

  3. 机器学习基础 KNN(K近邻)算法及sklearn的基本使用(附带一些基础概念)

    文章目录 一. K-近邻算法简介 1. 什么是K-近邻算法 1.1 K-近邻算法(KNN)概念 1.2 电影类型分析 1.3 KNN算法流程总结 2. 小结 二.K近邻算法api初步使用 1. Sci ...

  4. 【Python机器学习】多项式回归、K近邻KNN回归的讲解及实战(图文解释 附源码)

    需要源码请点赞关注收藏后评论区留言私信~~~ 多项式回归 非线性回归是用一条曲线或者曲面去逼近原始样本在空间中的分布,它"贴近"原始分布的能力一般较线性回归更强. 多项式是由称为不 ...

  5. Python机器学习基础教程-第2章-监督学习之K近邻

    前言 本系列教程基本就是摘抄<Python机器学习基础教程>中的例子内容. 为了便于跟踪和学习,本系列教程在Github上提供了jupyter notebook 版本: Github仓库: ...

  6. Python 机器学习实战 —— 无监督学习(下)

    前言 在上篇< Python 机器学习实战 -- 无监督学习(上)>介绍了数据集变换中最常见的 PCA 主成分分析.NMF 非负矩阵分解等无监督模型,举例说明使用使用非监督模型对多维度特征 ...

  7. Python 机器学习实战 —— 无监督学习(上)

    ​​​ 前言 在上篇<Python 机器学习实战 -- 监督学习>介绍了 支持向量机.k近邻.朴素贝叶斯分类 .决策树.决策树集成等多种模型,这篇文章将为大家介绍一下无监督学习的使用. 无 ...

  8. python基础教程免费下载-《Python机器学习基础教程》高清版免费PDF下载

    Python机器学习基础教程-[德] 安德里亚斯·穆勒(Andreas C.Müller)[美]莎拉·吉多(Sarah Guido) 著,张亮(hysic) 译 下载地址1:网盘下载 下载地址2:网盘 ...

  9. 【机器学习】sklearn机器学习入门案例——使用k近邻算法进行鸢尾花分类

    1 背景 这个案例恐怕已经被说的很烂了,机器学习方面不同程度的人对该案例还是有着不同的感觉.有的人追求先理解机器学习背后的理论甚至自己推导一遍相关数学公式,再用代码实现:有的人则满足于能够实现相关功能 ...

  10. 计算机视觉面试宝典--深度学习机器学习基础篇(四)

    计算机视觉面试宝典–深度学习机器学习基础篇(四) 本篇主要包含SVM支持向量机.K-Means均值以及机器学习相关常考内容等相关面试经验. SVM-支持向量机 支持向量机(support vector ...

最新文章

  1. window对象提供的功能之窗口最大化
  2. Android Studio 中的FindBugs插件使用,轻松帮你发现Bug (转)
  3. ITK:对多个线程上的数据进行操作以利用多核处理器
  4. 随机发送n位数字+字母的验证码
  5. gulp与webpack的区别
  6. python随机森林特征重要性_Python中随机森林回归的特征重要性
  7. 存储芯片在智能化产业链中扮演的角色将更加重要
  8. RocketMQ之事务消息
  9. 移动端图片上传后进行压缩功能
  10. 软件工程 选课系统的uml类图_想成为高级程序猿,面向对象建模和UML你不应该知道?...
  11. scala type关键字用于起别名
  12. 印尼Widya Robotics携手华为云,让建筑工地安全看得见
  13. 平衡小车——编码器原理及其使用
  14. 计算机犯罪率增长,我国的计算机年犯罪率的增长是()
  15. 2022-2028全球与中国防爆照明LED灯市场现状及未来发展趋势
  16. RNA-seq的典型流程(protocol)
  17. word 批量设置图片大小
  18. 约8937亿元:台积电创下台湾企业市值最高纪录
  19. 淘宝客如何通过闲鱼引流?淘宝客、闲鱼营销推广方式有哪些?
  20. 荣耀7 能升级鸿蒙系统吗,刷机精灵V3.4.7发布 新增支持荣耀7等一键刷机

热门文章

  1. java 对象给对象赋值为空_java中,只声明一个对象不赋值,与声明一个对象并赋为 null 的区别...
  2. 简易web服务器系统毕业论文设计,毕业论文 简易的WEB服务器的设计
  3. 如何理解操作系统的不确定性_如何创造可信任的机器学习模型?先要理解不确定性...
  4. c++中的explicit关键字及隐式类型转换
  5. 文件服务器php源码,php 在服务器上载文件
  6. java项目没有xml,利用eclipse新建的java web项目没有部署描述符web.xml文件怎么办?...
  7. 只能上qq不能开网页_真实记录女友和我开工作室之旅4:7.1~7.5日志记录和总结...
  8. Android studio 设置默认打开项目,默认打开项目方式
  9. 设计模式之——动态代理模式
  10. mac的rubywoo怎么读_macrubywoo是几号