模型的选择与调优：

主要方法：1.交叉验证

2.网格搜索

交叉选择和网格搜索的结合是为了能够寻找一个合适的超参数。

交叉验证：

数据分为：训练集与测试集。现在我们撇开测试集，只是对训练集进行操作，将训练集分为训练集与验证集。

网格搜索：

调参数 K-近邻的超参数K值的选择。

通常情况下，有很多参数是需要手动指定的（如k-近邻算法中的K值），

这种叫超参数。但是手动过程繁杂，所以需要对模型预设几种超参数组

合。每组超参数都采用交叉验证来进行评估。最后选出最优参数组合建

立模型。

API:

sklearn.model_selection.GridSearchCV

API解释：

sklearn.model_selection.GridSearchCV(estimator, param_grid=None,cv=None)

对估计器的指定参数值进行详尽搜索

estimator：估计器对象，也就是需要参数的实例化对象

param_grid：估计器参数(dict){“n_neighbors”:[1,3,5]}。需要用字典格式，可提前编辑好！！！

cv：指定几折交叉验证

fit：输入训练数据

score：准确率

结果分析：

best_score_:在交叉验证中测试的最好结果

best_estimator_：最好的参数模型

cv_results_:每次交叉验证后的测试集准确率结果和训练集准确率结果

算法：

"""# 进行算法流程knn = KNeighborsClassifier(n_neighbors=5)# fit, predict, ````knn.fit(train_x, train_y)# 得出预测结果y_predict = knn.predict(test_x)print("预测结果", y_predict)# 预测准确率print("准确率:", knn.score(test_x, test_y))"""# K值选择dict = {"n_neighbors": [1,2,3,5,10]}# 进行算法流程交叉验证和网格搜索进行K值的选择knn = KNeighborsClassifier()gv = GridSearchCV(knn, param_grid=dict, cv= 10)# fit, predict, ````gv.fit(train_x, train_y)# 得出预测结果y_predict = gv.predict(test_x)print("预测结果", y_predict)# 预测准确率print("准确率:", gv.score(test_x, test_y))

机器学习-------算法（七）相关推荐

ML之分类预测：基于sklearn库的七八种机器学习算法利用糖尿病(diabetes)数据集(8→1)实现二分类预测
ML之分类预测:基于sklearn库的七八种机器学习算法利用糖尿病(diabetes)数据集(8→1)实现二分类预测目录输出结果数据集展示输出结果 1.k-NN 2.LoR 4.DT 5.RF ...
机器学习算法（七）: 基于LightGBM的分类预测（基于英雄联盟10分钟数据判断红蓝方胜负）
机器学习算法(七)基于LightGBM的分类预测 1. 实验室介绍 1.1 LightGBM的介绍 LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,由20 ...
机器学习算法（七）：朴素贝叶斯方法
机器学习算法(七):朴素贝叶斯方法朴素贝叶斯方法是基于贝叶斯定理与特征条件独立假设的分类方法.对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布:然后基于此模型,对于给定的输 ...
A.机器学习入门算法[七]：基于英雄联盟数据集的LightGBM的分类预测
[机器学习入门与实践]入门必看系列,含数据挖掘项目实战:数据融合.特征优化.特征降维.探索性分析等,实战带你掌握机器学习数据挖掘专栏详细介绍:[机器学习入门与实践]合集入门必看系列,含数据挖掘项目实 ...
基于Spark的机器学习实践 (七) - 回归算法
0 相关源码 1 回归分析概述 1.1 回归分析介绍 ◆ 回归与分类类似,只不过回归的预测结果是连续的,而分类的预测结果是离散的 ◆ 如此,使得很多回归与分类的模型可以经过改动而通用 ◆ 因此对于回归 ...
gbdt 算法比随机森林容易_机器学习（七）——Adaboost和梯度提升树GBDT
1.Adaboost算法原理,优缺点: 理论上任何学习器都可以用于Adaboost.但一般来说,使用最广泛的Adaboost弱学习器是决策树和神经网络.对于决策树,Adaboost分类用了CART分类 ...
郑捷《机器学习算法原理与编程实践》学习笔记（第七章预测技术与哲学）7.1 线性系统的预测...
7.1.1 回归与现代预测 7.1.2 最小二乘法 7.1.3 代码实现 (1)导入数据 def loadDataSet(self,filename): #加载数据集X = [];Y = []fr = ...
机器学习第七章之K近邻算法
K近邻算法(了解) 7.1 K近邻算法 7.1.1 K近邻算法的原理介绍 7.1.2 K近邻算法的计算步骤及代码实现 7.2 数据预处理之数据归一化 7.2.1 min-max标准化 7.2.2 Z- ...
小姐姐带你一起学：如何用Python实现7种机器学习算法（附代码）
编译 | 林椿眄出品 | AI科技大本营(公众号ID:rgznai100) [AI科技大本营导读]Python 被称为是最接近 AI 的语言.最近一位名叫Anna-Lena Popkes的小姐姐在G ...
机器学习算法与Python实践之（二）支持向量机
http://blog.csdn.net/zouxy09/article/details/17291543 机器学习算法与Python实践这个系列主要是参考<机器学习实战>这本书.因为自己 ...

机器学习-------算法（七）

模型的选择与调优：

网格搜索：

机器学习-------算法（七）相关推荐

最新文章

热门文章