一:当我们训练出一个模型,我们不知道这个模型是好还是坏,我们如果应用到真实环境,结果预测的没有可信度,所以在输入样例之前先对模型进行测试。这时,我们就要将我们所有的数据分为两部分,一大部分用来训练,一小部分用来测试,一般比例在8:2。也就是我们会有两套数据集,一个是训练集,另一个是测试集。

二:鸢尾花举例说明

#测试机器学习算法的好坏import numpy as np
from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifieriris = datasets.load_iris()#读取数据
x = iris.data #获取特征数据
y = iris.target#获取样本标记shuffle_indexs = np.random.permutation(len(x)) #将索引打乱顺序,因为这里面的标记都是排好序的,不打乱顺序,不能将所有的标记加载到训练集中test_radio = 0.2
test_size = int(test_radio*len(x))#获取训练的下标和测试的下标
train_indexs = shuffle_indexs[test_size:]
test_indexs = shuffle_indexs[:test_size]#获取训练集的数据和测试集的数据
x_train = x[train_indexs]
y_train = y[train_indexs]x_test = x[test_indexs]
y_test = y[test_indexs]#KNN算法执行
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(x_train,y_train)
y_predict = knn.predict(x_test) #预测结果
rate = sum(y_predict==y_test)/len(y_test) #求比例print(rate)#准确率

转载于:https://www.cnblogs.com/lyr999736/p/10654374.html

测试机器学习算法的好坏相关推荐

  1. 算法测试—机器学习算法评价指标

    目录 一.分类问题 二.回归问题 三.聚类 四.信息检索 五.总结 在使用机器学习算法过程中,针对不同的问题需要不用的模型评估标准,这里统一汇总.主要以两大类分类与回归分别阐述. 一.分类问题 1.混 ...

  2. etc的常见算法_运用机器学习算法研究城市形态与户外温度之间的相关性

    随着城市化进程以及气候变化的加剧,城市正经历着频率更高.强度更大.持续时间更长的热浪天气.目前学者提出许多研究不同尺度气候问题的方法,其中最常用的是参数回归方法,如最小二乘法回归模型(OLS,ordi ...

  3. 【AI测试】机器学习项目的测试,算法测试

    目录 一.算法测试 1.模型评估 2.鲁棒性 (robustness) 3.模型安全 4.响应速度 二.业务测试 三.白盒测试 四.模型监控 五.算法测试学习入门 一.算法测试 1.模型评估 如何评估 ...

  4. 机器学习算法:补一个k-近邻算法的测试

    之前写k-近邻算法(http://boytnt.blog.51cto.com/966121/1569629)的时候,没附上测试数据,这回找了一个,测试一下算法的效果.数据来源于http://archi ...

  5. python3.6实现Softmax Regression测试训练模型(可视化)机器学习算法(赵志勇)学习笔记

    使用Python3.6实现机器学习算法(赵志勇),并将训练结果可视化 import numpy as np import matplotlib.pyplot as pltdef gradientAsc ...

  6. 【机器学习】机器学习算法优缺点对比(汇总篇)

    作者 | 杜博亚 来源 | 阿泽的学习笔记 「本文的目的,是务实.简洁地盘点一番当前机器学习算法」.文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的 ...

  7. 机器学习算法优缺点对比及选择(汇总篇)

    杜博亚 本文的目的,是务实.简洁地盘点一番当前机器学习算法.文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的经验,将对此模型优缺点及选择详加讨论. ...

  8. python回归算法_机器学习算法之回归详解

    导语 回归:从一组数据出发,确定某些变量之间的定量关系式:即建立数学模型并估计未知参数. 回归的目的是预测数值型的目标值,它的目标是接受连续数据,寻找最适合数据的方程,并能够对特定值进行预测.这个方程 ...

  9. 「机器学习」机器学习算法优缺点对比(汇总篇)

    作者 | 杜博亚 来源 | 阿泽的学习笔记 「本文的目的,是务实.简洁地盘点一番当前机器学习算法」.文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的 ...

最新文章

  1. OpenCV代码提取:resize函数的实现
  2. 过采样为什么能提高信噪比
  3. 麦当劳java排班_学习肯德基排班管理系统
  4. Java 9.while语句
  5. ct检查床的移动精度是指_炮塔铣床、数控铣床导轨平行度(扭曲)的检验
  6. 需求管理工具比较 Doors_Requistie Pro_RDM
  7. 2019人工智能实战 第六次作业 段峙宇
  8. 华为服务器更换主板后怎么进系统,服务器更换主板
  9. 工业摄像头传感器尺寸与像元尺寸的关系
  10. java前沿技术有哪些,写给正在求职的Java开发
  11. window.requestAnimationFrame讲解
  12. 手机端页面Html设置
  13. 大学生笔记本选Mac还是Windows?
  14. Mol Cell Proteomics. |陈洁| 整合鸟枪法蛋白质组学中鉴定和定量的错误率
  15. Python 进阶必备:线程模块 threading
  16. URL地址中的%2F、%3F、%3D、%3A是什么意思
  17. 人工智能 计算机语言学,语言学与人工智能的未来
  18. lua移植到STM32F4全过程
  19. vin7 安装vue教程(一路都是泪)
  20. opencv2/3播放视频实现进度条显示拖动、快进、快退、逐帧播放、显示当前帧于图像

热门文章

  1. VUE颜色选择器插件vColorPicker
  2. 【链表】删除链表的倒数第n个节点
  3. 【深度优先搜索】记忆化搜索 P1077 摆花
  4. PYTHON 笔记:函数的参数(关键字参数,默认参数,可变长参数,可变长的关键字参数)
  5. python程序设计和c语言_C 语言和 Python,该从哪个入门编程?
  6. centos8安装mysql_Linux宝塔面板安装
  7. ES Filebeat 使用 Pipeline 处理日志中的 @timestamp
  8. PowerDesigner通过jdbc连接MySQL实现逆向工程步骤
  9. layUI table 按条件搜索 结果整个页面刷新
  10. Windows引导及安装