介绍

在本教程中,我们将讨论一种非常强大的优化(或自动化)算法,即网格搜索算法。它最常用于机器学习模型中的超参数调整。我们将学习如何使用Python来实现它,以及如何将其应用到实际应用程序中,以了解它如何帮助我们为模型选择最佳参数并提高其准确性。

先决条件

要遵循本教程,您应该对Python或其他某种编程语言有基本的了解。您最好也具有机器学习的基本知识,但这不是必需的。除此之外,本文是初学者友好的,任何人都可以关注。

安装

要完成本教程,您需要在系统中安装以下库/框架:

它们的安装都非常简单-您可以单击它们各自的网站,以获取各自的详细安装说明。通常,可以使用pip安装软件包:

$ pip install numpy pandas tensorflow keras scikit-learn

如果遇到任何问题,请参考每个软件包的官方文档。

什么是网格搜索?

网格搜索本质上是一种优化算法,可让你从提供的参数选项列表中选择最适合优化问题的参数,从而使“试验和错误”方法自动化。尽管它可以应用于许多优化问题,但是由于其在机器学习中的使用而获得最广为人知的参数,该参数可以使模型获得最佳精度。

假设您的模型采用以下三个参数作为输入:

隐藏层数[2,4]

每层中的神经元数量[5,10]

神经元数[10,50]

如果对于每个参数输入,我们希望尝试两个选项(如上面的方括号中所述),则总计总共2 ^3 = 8个不同的组合(例如,一个可能的组合为[2,5,10])。手动执行此操作会很麻烦。

现在,假设我们有10个不同的输入参数,并且想为每个参数尝试5个可能的值。每当我们希望更改参数值,重新运行代码并跟踪所有参数组合的结果时,都需要从我们这边进行手动输入。网格搜索可自动执行该过程,因为它仅获取每个参数的可能值并运行代码以尝试所有可能的组合,输出每个组合的结果,并输出可提供最佳准确性的组合。

网格搜索实施

让我们将网格搜索应用于实际应用程序。讨论机器学习和数据预处理这一部分不在本教程的讨论范围之内,因此我们只需要运行其代码并深入讨论Grid Search的引入部分即可。

我们将使用Pima印度糖尿病数据集,该数据集包含有关患者是否基于不同属性(例如血糖,葡萄糖浓度,血压等)的糖尿病信息。使用Pandas read_csv()方法,您可以直接从在线资源中导入数据集。

以下脚本导入所需的库:

from sklearn.model_selection import GridSearchCV, KFold

from keras.models import Sequential

from keras.layers import Dense, Dropout

from keras.wrappers.scikit_learn import KerasClassifier

from keras.optimizers import Adam

import sys

import pandas as pd

import numpy as np

以下脚本导入数据集并设置数据集的列标题。

df = pd.read_csv(data_path, names=columns)

让我们看一下数据集的前5行:

df.head()

输出:

如你所见,这5行都是用来描述每一列的标签,因此它们对我们没有用。我们将从删除这些非数据行开始,然后将所有NaN值替换为0:

for col in columns:

df[col].replace(0, np.NaN, inplace=True)

df.dropna(inplace=True) # Drop all rows with missing values

以下脚本将数据分为变量和标签集,并将标准化应用于数据集:

# Transform and display the training data

X_standardized = scaler.transform(X)

以下方法创建了我们简单的深度学习模型:

def create_model(learn_rate, dropout_rate):

# Create model

model = Sequential()

model.add(Dense(8, input_dim=8, kernel_initializer='normal', activation='relu'))

model.add(Dropout(dropout_rate))

model.add(Dense(4, input_dim=8, kernel_initializer='normal', activation='relu'))

model.add(Dropout(dropout_rate))

model.add(Dense(1, activation='sigmoid'))

# Compile the model

adam = Adam(lr=learn_rate)

model.compile(loss='binary_crossentropy', optimizer=adam, metrics=['accuracy'])

return model

这是加载数据集,对其进行预处理并创建您的机器学习模型所需的所有代码。因为我们只对看到Grid Search的功能感兴趣,所以我没有进行训练/测试拆分,我们将模型拟合到整个数据集。

在下一节中,我们将开始了解Grid Search如何通过优化参数使生活变得更轻松。

在没有网格搜索的情况下训练模型

在下面的代码中,我们将随机决定或根据直觉决定的参数值创建模型,并查看模型的性能:

model = create_model(learn_rate, dropout_rate)

输出:

Epoch 1/1

130/130 [==============================] - 0s 2ms/step - loss: 0.6934 - accuracy: 0.6000

正如看到的,我们得到的精度是60.00%。这是相当低的。

使用网格搜索优化超参数

如果不使用Grid Search,则可以直接fit()在上面创建的模型上调用方法。但是,要使用网格搜索,我们需要将一些参数传递给create_model()函数。此外,我们需要使用不同的选项声明我们的网格,我们希望为每个参数尝试这些选项。让我们分部分进行。

首先,我们修改create_model()函数以接受调用函数的参数:

# Create the model

model = KerasClassifier(build_fn=create_model, verbose=1)

现在,我们准备实现网格搜索算法并在其上拟合数据集:

# Build and fit the GridSearchCV

grid = GridSearchCV(estimator=model, param_grid=param_grid,

cv=KFold(random_state=seed), verbose=10)

输出:

Best: 0.7959183612648322, using {'batch_size': 10, 'dropout_rate': 0.2, 'epochs': 10, 'learn_rate': 0.02}

在输出中,我们可以看到它为我们提供了最佳精度的参数组合。

可以肯定地说,网格搜索在Python中非常容易实现,并且在人工方面节省了很多时间。您可以列出所有您想要调整的参数,声明要测试的值,运行您的代码,而不必理会。您无需再输入任何信息。找到最佳参数组合后,您只需将其用于最终模型即可。

结论

总结起来,我们了解了什么是Grid Search,它如何帮助我们优化模型以及它带来的诸如自动化的好处。此外,我们学习了如何使用Python语言在几行代码中实现它。为了了解其有效性,我们还训练了带有和不带有Grid Search的机器学习模型,使用Grid Search的准确性提高了19%。

python网格搜索法_Python中基于网格搜索算法优化的深度学习模型分析糖尿病数据...相关推荐

  1. 【基于 docker 的 Flask 的深度学习模型部署】

    文章目录 1.前言 2.docker简介 3.基于Falsk的REST API实现 4.编写dockerfile 5.基于docker的模型部署 1.前言 模型部署一直是深度学习算法走向落地的重要的一 ...

  2. 【NLP-NER】命名实体识别中最常用的两种深度学习模型

    命名实体识别(Named Entity Recognition,NER)是NLP中一项非常基础的任务.NER是信息提取.问答系统.句法分析.机器翻译等众多NLP任务的重要基础工具. 上一期我们介绍了N ...

  3. 基于python渗透测试_Python中基于属性的测试简介

    基于python渗透测试 by Shashi Kumar Raja 由Shashi Kumar Raja Python中基于属性的测试简介 (Intro to property-based testi ...

  4. python规则网格插值_Python中规则网格上的插值

    什么是合理的解决方案很大程度上取决于你试图用插值像素回答的问题--请注意清空器:对丢失的数据进行外推会导致非常误导的答案! 径向基函数插值/核平滑 就Python中可用的实际解决方案而言,填充这些像素 ...

  5. python地图散点图_Python中基于Basemap的三维散点图

    我正在尝试绘制一个三维散点图,图中是Python身上的烟羽,下面是北美的地图. 我试过各种方法,但似乎都有缺点. 我现在的代码是:fig = plt.figure(figsize=(22,4)) ax ...

  6. 单目标应用:基于麻雀搜索算法优化灰色神经网络(grey neural network)的数据预测(提供MATLAB代码)

    一.麻雀搜索算法 麻雀搜索算法(sparrow search algorithm,SSA)由Jiankai Xue等人于2020年提出,该算法是根据麻雀觅食并逃避捕食者的行为而提出的群智能优化算法.S ...

  7. AI Earth 深度学习模型替换数值天气预报模型中的参数化方案-大气辐射传输方案

    1.背景 太阳辐射和热辐射是大气和海洋运动的最根本的驱动力.大气辐射传输过程实际上已经可以通过一种叫做LBLRTM的辐射模型精确计算,但是LBLRTM模型同时也最为耗时.因此,有各种各样的辐射传输参数 ...

  8. 【深度学习】【物联网】深度解读:深度学习在IoT大数据和流分析中的应用

    作者|Natalie 编辑|Emily AI 前线导读:在物联网时代,大量的感知器每天都在收集并产生着涉及各个领域的数据.由于商业和生活质量提升方面的诉求,应用物联网(IoT)技术对大数据流进行分析是 ...

  9. 【深度学习】深度解读:深度学习在IoT大数据和流分析中的应用

    来源:网络大数据(ID:raincent_com) 摘要:这篇论文对于使用深度学习来改进IoT领域的数据分析和学习方法进行了详细的综述. 在物联网时代,大量的感知器每天都在收集并产生着涉及各个领域的数 ...

最新文章

  1. 新建silverlight项目提示未将对象设置到实例解决方案
  2. .Net中单元测试工具的比较(Moq, VS Fake, TypeMock)
  3. (转载)C#:Enum、Int和String的互相转换,枚举转换
  4. Linux线程——线程安全问题
  5. 华为系统鸿蒙优势,华为鸿蒙2.0可以替代安卓吗,华为鸿蒙2.0优势在哪
  6. 看了5种分布式事务方案,最终选择了Seata,真香!
  7. Bootstrap 弹出提示插件Popover 的选项
  8. mysql scale,Mailchimp Scale:a MySQL Perspective
  9. 简单的移动端打开pdf文件。
  10. 第一个servlet
  11. 移动通信原理中信道的分类
  12. 北航数理统计大作业_数学146分上岸复旦大学大数据学院统计学,备考经验分享!...
  13. html file 英文,(转)如何将input type=file显示的浏览 变成英文的?
  14. 计算文件及字符串的VBS脚本
  15. 基于Matlab的BiLSTM实现
  16. JVM内存与垃圾回收篇——直接内存
  17. 【原创】老谷项目管理MSN群6.23记录
  18. esp8266-01s介绍与使用
  19. 一个北京人的买房血泪史:我不想一辈子做房奴!
  20. mysql数据库管理实战 甘长春_MySQL数据库管理实战

热门文章

  1. Android学习笔记---Android利用Sqlite,并且用sql语言操作SQLite数据库
  2. 正则表达式 判断 连号如“123456”、同号如“888888”、连同号如“112233”“222333”...
  3. Apache Zookeeper 集群环境搭建
  4. mysql 三表inner join_MySql的join(连接)查询 (三表 left join 写法)
  5. html 脚本 gdi,基于gdi的简单画图
  6. 求某一维度的最大值_高中数学函数求最值常用方法总结
  7. 安卓设置菊花动画_华为手机必须调整的4个默认设置,让手机流畅到飞起,用到2035年...
  8. markdown 本地链接_五分钟快速入门Markdown
  9. 华为eNSP最稳定的装法
  10. 《计算机科学导论》百度云,【麻省理工学院】Python编程和计算机科学导论公开课(中英字幕)...