深度学习Caffe 入门理解使用教程

2019独角兽企业重金招聘Python工程师标准>>>

1.首先caffe 安装我就不解释了如果有人安装不会的话可以加我qq 1050316096 ，我会按照使用方式来介绍，首先打开caffe 的github开源项目

https://github.com/BVLC/caffe caffe 有一个缺点就是依赖的库太多，所以安装理解可能比较麻烦，好处就是网络定义使用google的 protoBuf方式以及层定义之间很明确清晰。

首先我来讲一下深度学习怎么来的。

普通的普通的模拟神经元其实就是 y=wx+b 多个来源也就是权重 W 以及偏重 B 参数的调整，于是就可以通过计算LOSS损失函数来控制梯度下降。所谓梯度下降就是调整参数让他往空间斜率的方向跑。 OK ,于是问题来了，这其实就是一个线性回归模型

后面人们发现可以通过多层的神经元相互组合形成多层神经元NN 进行训练，通过调整隐藏神经元从而达到你所需要的结果

其实这里面大体是一样的

OK 下面是国外一个教程的截图，其实就是每一层的参数都可以用上一层wx+b来代替，最后转换成第一层的wx+b 与最后一层的h(x)的问题，求解的问题，于是引入了loss损失函数来保证梯度下降。

我们知道每一层的输出其实就是一个wx+b 然后层层带入，因为我们可以用第一层的表示后面的相应的多层输入，我们也能知道结果，上图的H(X) 然后我们就能得到一个用第一层的wx+b表示的公司，所以最后求数学上的损失以及控制梯度下降都是转换成wx+b的问题，最后其实跟w x b相关的一个函数，我们知道现实中数据不是线性可分的有很多，线性回归问题，不能直接wx+b的线性回归模型来求解，于是人们采用多层模型嵌套，是的线性不可分的问题，像切蛋糕，一样类似于SVM, ，在空间平面上切切切，是的能够求解这类问题，后面，人们发现引入激活函数，调整参数会有更好的收敛性而且不容易陷入局部最优解梯度下降，比如下到半山腰。

常用的激活函数有sigol 还有tanh 这些数学就是一些数学上的曲线收敛函数、不过relu的收敛性比他们效果更好，所以现在深度学习在激活层上都一般采用relu

我下面说说我的理解。深度学习在上面的多层网络基础上，实现了整理梯度下降，每一次都有BP反馈，以及前向更改，以及批次量的训练以及 xvier的初始化权重这样来保证整理上梯度下降而不会陷入over fitting，另外计算机速度越来越快，所以深度学习遍发展起来了。

下面我们讲一讲caffe 的网络结构情况首先看到caffe下面的

我们可以看到有三个prototxt文件，因为caffe 定义网络是protoBuf定义的协议定义在src/caffe/proto/caffe.proto 这个文件里面，然后prototxt定义网络的层定义，当运行时候会读取txt 反系列化proto解析，并初始化定义文件里面的每一层每一层分布，初始化网络然后就开始训练。首先看看solver文件。他是入口，定义了网络的一些训练参数

这里面最注意到的是net 里面的train_val.pototxt 他是用来做训练测试时候的运行网络，但是实际的网络后面部署使用的网络是deploy.txt 也就是说，

这2个文件 deploy 与 train_val有一些区别，

1.因为是train_val 所以有测试有训练，你也可以分开2个文件来写，写成一个文件需要使用

include{

phase:Train/Test

}

这是表明该网络是在什么时候使用，是train/Test 还有就是他外部有个最大的最外层的layer 用来作为label 校验以及 input输入的最底层网络输入，所以因为他是用来校验调整，所以一般在后面会看到有两个bottom 以及 top 而且 SoftMax分类器是SoftMaxLoss 这样可以让层经过这个时候有个BP反馈。这是一些细微的差别。然后其他方面大体一致。因为deploy只是一个部署模型model 使用时候的网络文件，当然不会有这些loss 以及 label 测试等相关输入以及输出。

理解了这三个文件之后，我们来看看一个caffe的网络的layer构成组成。

通过type定义层的类型

下面讲一下几个基本常用的层的理解。详细所有的可以看看我下面的链接里面，有详细的介绍。

1.convetion 卷积层，因为图像有局部特征可以共享参数，所以可以通过局部特征特性来减少输入维度以及隐藏的参数。主要原理是，一个图像WXH的矩阵可以转换成一个卷积核个数以及图像矩阵的卷积核抽取的向量展开成的一维特征的矩阵，AXB 然后

每一张图像能抽取C个矩阵，这个可以算出来一个BxC的特征，然后矩阵剩法，至于GPU 就是在这些矩阵方面运行非常快加速了所以GPU训练比较快。

这样可以得到一个AXC的特征这就是做卷积的大概的结果。

2，pool 池化层，为了防止overfitting问题，类似于图像的金字塔法则，用平均最大等来代替卷积特征的，这样可以进一步缩小输出的抽象特征

3. relu激活层，一般都是relu 有较好的速度与性能，主要是原子层上的一层参数的调整。

4. softmax分类器loss损失层，主要做多元分类，、

5.全连接层主要把特征多维变成NX1X1X1 的输出特征，其实就是以前神经网络的NN一样，

然后多层网络之间上一层输出作为下一层的输入，

如果有实际上不理解的可以一起交流。这一方面 http://caffe.berkeleyvision.org/tutorial/layers.html

这是一个很好的教程，有哪些层，以及这些层的原理作用都有详细的介绍我觉得非常好的教程了。

这里我们大概知道了层的定义

所以有卷积层C 就叫做CNN 如果全部是连接层以及其他relu 以及 dropdown 等等就叫做DNN

如果每一层之间向下forward 时候以及 BP向上会考虑过去几层的权重以及相关loss 数据等等就叫做 RNN

如果每一层上一层输出的b 保留交给下一层计算进去就叫做深度残差网络、。resnet

了解了上面的需求后，我们就可以参考 caffe一些开源model 来构建自己的网络定义了。并使用到实际中。

我是一个java工程师，并不是专业学计算机深度学习研究的。不能理解内部的完整的数学算法，博士教授研究的东西数学也不够好，所以这只是我的一个理解，所以有什么不足很见谅。但是大家可以入门理解下。

先做到会使用就行了，慢慢的深入研究。会使用了就能够运用到实际中来。我现在比如用LSTM 来写诗句，用CNN来做训练图像理解。

这是运行的截图。注意到里面的shape么就是每一层输入输出的NXD向量

这是结果

下面的是测试结果

转载于:https://my.oschina.net/yilian/blog/651348

深度学习Caffe 入门理解使用教程相关推荐

【深度学习】入门理解ResNet和他的小姨子们（一）---ResNet
2015年由He KaiMing 大神提出的ResNet现在是一种经典模型.在这之前,虽然VGG的深度已经高达19层了,但是152层的ResNet真的让我们目瞪口呆. ResNet这篇文章则是CVP ...
caffe模型文件解析_深度学习 Caffe 初始化流程理解（数据流建立）
深度学习 Caffe 初始化流程理解(数据流建立) 之前在简书的文章,搬迁过来 ^-^ 本文是作者原创,如有理解错误,恳请大家指出,如需引用,请注明出处. #Caffe FeatureMap数据流的建 ...
深度学习小白入门教程-基础环境篇
深度学习小白入门教程-基础环境篇如有图片显示失败,请回小主主页查看~ Anaconda 安装包下载方式一:官网(科学上网比较慢,不推荐) 安装包下载方式二:清华镜像(推荐) 具体安装步骤(跟着箭头来 ...
图深度学习，入门教程七，残差多层图注意力模型
深度学习还没学完,怎么图深度学习又来了?别怕,这里有份系统教程,可以将0基础的你直接送到图深度学习.还会定期更新哦. 主要是基于图深度学习的入门内容.讲述最基本的基础知识,其中包括深度学习.数学.图神 ...
150页书籍《PyTorch 深度学习快速入门指南》附PDF电子版
为什么说是极简教程,首先本书只涵盖了150页.内容比较精简,特别适合作为 PyTorch 深度学习的入门书籍.为什么这么说呢?因为很多时候,一份厚重的书籍往往会削弱我们学习的积极性,在学习一门新的语言 ...
深度学习动手入门：GitHub上四个超棒的TensorFlow开源项目
原文:http://www.techweb.com.cn/news/2017-07-31/2566452.shtml 深度学习动手入门:GitHub上四个超棒的TensorFlow开源项目 2017. ...
运用深度学习教机器人理解自然语言
运用深度学习教机器人理解自然语言 2016-08-16 16:33 转载 CSDN 1条评论雷锋网按:本文作者Jonathan是21CT的首席科学家.他主要研究机器学习和人工智能如何使用在文本和知识 ...
【机器学习】机器学习和深度学习概念入门
机器学习和深度学习概念入门(上) 作者:谭东来源:机器学习算法与自然语言处理目录 1 人工智能.机器学习.深度学习三者关系 2 什么是人工智能 3 什么是机器学习 4 机器学习之 ...
《Keras深度学习：入门、实战与进阶》之印第安人糖尿病诊断
本文摘自<Keras深度学习:入门.实战与进阶>. 1.数据理解本节使用Pima Indians糖尿病发病情况数据集.该数据集最初来自国家糖尿病/消化/肾脏疾病研究所.数据集的目标是基于 ...

深度学习Caffe 入门理解使用教程

深度学习Caffe 入门理解使用教程相关推荐

最新文章

热门文章