以95％的精度构建CNN模型

介绍

如果你决心制作一个CNN模型，使其准确性达到95％以上，那么这可能是适合你的博客。

我们将分三部分解决这个问题

迁移学习
数据扩充
处理过拟合和欠拟合问题

迁移学习

迁移学习是通过从已经学习的相关任务中迁移知识来改进新任务中学习的方法。

用简单的话来说，迁移学习的思想是，我们使用从图像分类任务中预先训练的模型，而不是从头开始训练新模型。

为什么要使用迁移学习？

迁移学习是一种优化，是节省时间或获得更好性能的捷径。

通常，在模型开发和评估之前，在领域中使用迁移学习不会有好处。但是在大多数情况下，迁移学习比起从头训练的模型提供更好的结果

迁移学习的主要好处是：

更高的起点：源模型的初始点（在精炼模型之前）比其他方法要高。
**更高的斜率：**在对源模型进行训练的过程中，其提高速度为比其他情况更快。
**更高的渐近线：**训练后的模型收敛要优于其他方式。

此图总结了上述的3个点，你可以看到将迁移学习应用于模型时，训练从更高的点开始，从而更快地达到更高的准确度。

Tensorflow中的迁移学习

在本教程中，我们将讨论如何使用Tensorflow Hub在Tensorflow模型中使用迁移学习。

Tensorflow Hub是一个收集各种预训练模型的地方，例如ResNet，MobileNet，VGG-16等。它们还具有用于图像分类，语音识别等的不同模型。在Tensorflow Hub中可用的迁移学习模型中最后的输出层将被删除，以便我们可以使用自定义的类数插入输出层。

Tensorflow Hub：https://www.tensorflow.org/hub

URL = "https://tfhub.dev/google/tf2-preview/mobilenet_v2/feature_vector/2"
feature_extractor = hub.KerasLayer(URL,input_shape=(IMG_SHAPE, IMG_SHAPE,3))

在这里，我们使用了MobileNet模型，你可以在TensorFlow Hub网站上找到不同的模型。

每种型号都有特定的输入图像大小，将在网站上提及。

在我们的MobileNet模型中，此处提到的图像尺寸为224×224，因此在使用传输模型时，请确保将所有图像的尺寸调整为该特定尺寸。

feature_extractor.trainable = False

在声明你的迁移学习模型后，请确保包含上面的代码，以确保该模型不会再次从头开始进行训练

现在我们可以定义我们的自定义模型：

no_of_output_classes=4
from tensorflow.keras import layers
model = tf.keras.Sequential([feature_extractor,layers.Dense(No_of_output_classes)   # make sure this number is the same number as output classes
])
model.summary()

现在，我们可以像运行任何普通模型一样运行model.compile和model.fit。

数据扩充

拥有大型数据集对于深度学习模型的性能至关重要。但是，我们可以通过增加现有数据来提高模型的性能。它还可以帮助模型对不同类型的图像进行概括。在数据扩充中，我们添加了不同的过滤器或略微更改了已有的图像，例如添加了随机放大，缩小，以随机角度旋转图像，模糊图像等。

这显示了旋转数据的扩充

Tensorflow中的数据增强

如果你在Tensorflow中使用 ImageDataGenerator，则可以轻松应用数据增强

ImageDataGenerator:https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/image/ImageDataGenerator

image_gen_train = ImageDataGenerator(     # here we use the ImageDataGeneratorrescale=1./255,rotation_range=40,width_shift_range=0.2,                # Applaying these all Data Augmentationsheight_shift_range=0.2,shear_range=0.2,zoom_range=0.2,horizontal_flip=True,fill_mode='nearest')

这些是可用的不同数据扩充的示例，更多信息在TensorFlow文档中查看。

TensorFlow文档：https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/image/ImageDataGenerator

然后我们可以将这些增强应用于我们的图像

train_data_gen = image_gen_train.flow_from_directory(batch_size=BATCH_SIZE,     # Batch siz emeans at a time it takes 100directory=train_dir,    # Here we put shuffle= True so tat model doesnt memorise ordershuffle=True,target_size=(IMG_SHAPE,IMG_SHAPE),class_mode='binary')

这里的 train_dir 是我们的训练图像所在的目录路径。

处理过拟合和欠拟合问题

过度拟合

当模型学习训练数据中的细节和噪声时，就会过度拟合，从而对模型在新数据上的性能产生负面影响。

换句话说，过度拟合的模型在训练集上表现良好，而在测试集上表现不佳，这意味着当涉及到新数据时，该模型似乎无法泛化

正如你在过度拟合中看到的，它过于具体地学习训练数据集，并且在给定新数据集时，会对模型产生负面影响。

欠拟合

欠拟合是相反的情况，在这种情况下，模型无法从训练数据中学到足够多的知识，以至于在训练和测试数据集上都做得不好。当没有足够的数据可进行训练时，通常会发生这种情况。

克服过度拟合的方法：

有两种方法可以解决过度拟合问题：

1）使用更多的训练数据

这是克服过度拟合的最简单方法

2）使用数据扩充

数据增强可以帮助你克服过度拟合的问题。上文已深入讨论了数据扩充。

3）知道何时停止训练

换句话说，知道你想要训练模型的时期数在决定模型是否适合方面具有重要作用

你可以通过绘制训练集和验证集的损失或精度与epoch图来获得想要训练模型的确切数字。

如你所见，在早期停止状态之后，验证集损失会增加，但是训练集值会继续减少。在准确的模型中，无论是训练还是验证，准确性都必须降低

所以这里对应于早期停止值的epoch值就是我们的epoch数

这是未过度拟合或未拟合的模型的示例。

结论

通过遵循这些方法，你可以使CNN模型的验证集准确性超过95％。

该项目的完整代码可在这个GitHub上找到：https://github.com/aromaljosebaby。

☆ END ☆

如果看到这里，说明你喜欢这篇文章，请转发、点赞。微信搜索「uncle_pn」，欢迎添加小编微信「 mthler」，每日朋友圈更新一篇高质量博文。

↓扫描二维码添加小编↓