模型的选择与调优:

主要方法:1.交叉验证

2.网格搜索

交叉选择和网格搜索的结合是为了能够寻找一个合适的超参数。

交叉验证:

数据分为:训练集与测试集。现在我们撇开测试集,只是对训练集进行操作,将训练集分为训练集与验证集。

网格搜索:

调参数   K-近邻的超参数K值的选择。

通常情况下,有很多参数是需要手动指定的(如k-近邻算法中的K值),

这种叫超参数。但是手动过程繁杂,所以需要对模型预设几种超参数组

合。每组超参数都采用交叉验证来进行评估。最后选出最优参数组合建

立模型。

API:

sklearn.model_selection.GridSearchCV

API解释:

sklearn.model_selection.GridSearchCV(estimator, param_grid=None,cv=None)
对估计器的指定参数值进行详尽搜索
estimator:估计器对象,也就是需要参数的实例化对象
param_grid:估计器参数(dict){“n_neighbors”:[1,3,5]}。需要用字典格式,可提前编辑好!!!
cv:指定几折交叉验证
fit:输入训练数据
score:准确率
结果分析:
best_score_:在交叉验证中测试的最好结果
best_estimator_:最好的参数模型
cv_results_:每次交叉验证后的测试集准确率结果和训练集准确率结果

算法:

"""# 进行算法流程knn = KNeighborsClassifier(n_neighbors=5)# fit, predict, ````knn.fit(train_x, train_y)# 得出预测结果y_predict = knn.predict(test_x)print("预测结果", y_predict)# 预测准确率print("准确率:", knn.score(test_x, test_y))"""# K值选择dict = {"n_neighbors": [1,2,3,5,10]}# 进行算法流程交叉验证和网格搜索进行K值的选择knn = KNeighborsClassifier()gv = GridSearchCV(knn, param_grid=dict, cv= 10)# fit, predict, ````gv.fit(train_x, train_y)# 得出预测结果y_predict = gv.predict(test_x)print("预测结果", y_predict)# 预测准确率print("准确率:", gv.score(test_x, test_y))

机器学习-------算法(七)相关推荐

  1. ML之分类预测:基于sklearn库的七八种机器学习算法利用糖尿病(diabetes)数据集(8→1)实现二分类预测

    ML之分类预测:基于sklearn库的七八种机器学习算法利用糖尿病(diabetes)数据集(8→1)实现二分类预测 目录 输出结果 数据集展示 输出结果 1.k-NN 2.LoR 4.DT 5.RF ...

  2. 机器学习算法(七): 基于LightGBM的分类预测(基于英雄联盟10分钟数据判断红蓝方胜负)

    机器学习算法(七)基于LightGBM的分类预测 1. 实验室介绍 1.1 LightGBM的介绍 LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,由20 ...

  3. 机器学习算法(七):朴素贝叶斯方法

    机器学习算法(七):朴素贝叶斯方法 朴素贝叶斯方法是基于贝叶斯定理与特征条件独立假设的分类方法.对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布:然后基于此模型,对于给定的输 ...

  4. A.机器学习入门算法[七]:基于英雄联盟数据集的LightGBM的分类预测

    [机器学习入门与实践]入门必看系列,含数据挖掘项目实战:数据融合.特征优化.特征降维.探索性分析等,实战带你掌握机器学习数据挖掘 专栏详细介绍:[机器学习入门与实践]合集入门必看系列,含数据挖掘项目实 ...

  5. 基于Spark的机器学习实践 (七) - 回归算法

    0 相关源码 1 回归分析概述 1.1 回归分析介绍 ◆ 回归与分类类似,只不过回归的预测结果是连续的,而分类的预测结果是离散的 ◆ 如此,使得很多回归与分类的模型可以经过改动而通用 ◆ 因此对于回归 ...

  6. gbdt 算法比随机森林容易_机器学习(七)——Adaboost和梯度提升树GBDT

    1.Adaboost算法原理,优缺点: 理论上任何学习器都可以用于Adaboost.但一般来说,使用最广泛的Adaboost弱学习器是决策树和神经网络.对于决策树,Adaboost分类用了CART分类 ...

  7. 郑捷《机器学习算法原理与编程实践》学习笔记(第七章 预测技术与哲学)7.1 线性系统的预测...

    7.1.1 回归与现代预测 7.1.2 最小二乘法 7.1.3 代码实现 (1)导入数据 def loadDataSet(self,filename): #加载数据集X = [];Y = []fr = ...

  8. 机器学习第七章之K近邻算法

    K近邻算法(了解) 7.1 K近邻算法 7.1.1 K近邻算法的原理介绍 7.1.2 K近邻算法的计算步骤及代码实现 7.2 数据预处理之数据归一化 7.2.1 min-max标准化 7.2.2 Z- ...

  9. 小姐姐带你一起学:如何用Python实现7种机器学习算法(附代码)

    编译 | 林椿眄 出品 | AI科技大本营(公众号ID:rgznai100) [AI科技大本营导读]Python 被称为是最接近 AI 的语言.最近一位名叫Anna-Lena Popkes的小姐姐在G ...

  10. 机器学习算法与Python实践之(二)支持向量机

    http://blog.csdn.net/zouxy09/article/details/17291543 机器学习算法与Python实践这个系列主要是参考<机器学习实战>这本书.因为自己 ...

最新文章

  1. 深入理解javascript异步编程障眼法h5 web worker实现多线程
  2. mongodb java findone_java-MongoRepository findOne使用“ id”代替“ _id”
  3. 解决python安装第三方库速度很慢的问题(opencv为例)
  4. “三农”谋定金融 中国农民丰收节交易会金融服务研讨会
  5. 【渝粤教育】国家开放大学2018年秋季 2604T城市轨道交通行车组织 参考试题
  6. idea在分屏拖不回来_朋友圈赏花晒照新玩法,宫格分屏视频!
  7. iPhone 13将减产1000万部,因特定芯片供应不足
  8. 《JavaScript设计模式》读书笔记模板方法模式
  9. ueditor 文件服务器,ueditor-extend: 对百度UEditor编辑器做扩展,开放文件存储方法和获取远程文件列表方法,使其更灵活,更容易和独立的文件服务或者文件存储的云服务结合。...
  10. php5.3升级脚本
  11. 华为s5700交换机使用配置
  12. Winserver普通域用户账户无权限启动停止系统服务(启动停止按钮是灰色)
  13. ILSVRC2012下载+训练
  14. 冯.诺依曼计算机结构要点
  15. 疫情中的云与教育:“停课不停学”背后的百度技术密码
  16. hdu 2881 Jack's struggle(DP)
  17. 网页登录页面模板下载
  18. 《关键对话》思维导图
  19. 计算机显卡维修,pci-e显卡基本维修教程
  20. http://jackwang1.blog.163.com/blog/static/39534478201182651610201/

热门文章

  1. 为什么打工,越打越穷?
  2. Substance Painter Mari 导出 到MarmosetToolBag
  3. Cesium开发工具篇 | 07回顾总结
  4. 基于单臂路由的公司网络搭建
  5. 软件成分分析:华为云重磅发布开源软件治理服务
  6. 梦幻西游卖号显示该服务器没有角色,《梦幻西游》第一神豪秦奋要卖号了,35个角色价值过亿现四折出售,是因为没钱了吗?...
  7. C语言课程设计——仓库物资管理系统
  8. 实习日记——Day8
  9. unity之NPC人物名称显示
  10. [Unity][UGUI]用UGUI自带的Canvas角色头顶的名字