作者 | Javier Casas Velasco

译者 | 弯月,责编 | 屠敏

出品 | CSDN(ID:CSDNnews)

什么是caffe

Caffe 全称:Convolution Architecture For Feature Extraction(用于特征抽取的卷积框架)。

Caffe是一个清晰、可读性高、快速的深度学习框架。

Caffe前身是decaf,由加州伯克利大学博士贾扬青开发的一个用于深度卷积网络的Python框架(无GPU)模式,之后被伯克利大学实验室团队丰富成caffe。

Caffe的特点

  • Expression:通过文本来构建模型和优化策略,而不是代码。

  • Speed:现有的CNN模型中速度最快。在NVIDIA K40 或Titan GPU*上,训练一张图片要5ms,测试一张图片要2ms。

  • Modularity:易扩展

  • 纯C++/CUDA构建的框架,提供了命令行、Python、MATLAB接口

  • 实现了CPU和GPU的无缝结合

  • Caffe Model Zoo :model share

CNN框架:LeNet

1998年LeCun 提出的用于手写字体的卷积神经网络。

CNN框架:AlexNet

AlexNet :2012年Hinton教授和其他学生Alex Krizhevsky, llya Sutskever提出的用于图像识别的CNN框架。

数据层(data_layer)

caffe 通过数据层获取数据。数据的来源可以是多种形式。例如:

  • LevelDB,LMDB(两种键值对嵌入式数据库管理系统编程库,一般LMDB比LevelDB存取速度快,所以caffe默认的事LMDB)

  • 直接从内存读取

  • HDF5文件

  • 原始图片

类 data_layer.hpp/data_layer.cpp

在定义网络的prototxt 文件中可以定义数据层的形式,比如手写字体数据层定义如下:

数据传递(blob)

  • caffe框架中数据是以blob的形式进行传递

  • blob是一个标准的数组,主要负责caffe中数据的存储(store),关联(communicate)。数据在网络结构中要经过正向和反向的传播的过程,在这个过程中要对数据进行存储、数据之间进行通信、以及数据的操作。blob就是负责这个过程。

在具体的形式上blob是回一个4-D结构的array,是按照(Num, Channels. Height, Width)的顺序存储的。

  • Nums:表示一次训练输入的图片数量

  • Channels:表示通道数

  • Height:表示图片高度

  • Width:表示图片的宽度

  • 实际上blob 是存储的数据在内存中的索引,比如index(n,k,h,w)定位在((n*k + k)*H + h)*W+w。示意图如下:

卷积层(convolution)

卷积层定义了图像的卷积操作(即特征抽象),参数设置在prototxt中 ,它相关的类定义在conv_layer.cpp。

例如用到的一个卷积:

受限线性单元(RELU)

RELU的全称:rectified linear units。

受限线性单元实际上就是激活函数max(0,x), 它的相关类定义在relu_layer.cpp中。

相比之下,ReLU的速度非常快,而且精准度更高。因此ReLU逐渐取代sigmoid成为主流

池化层(POOLING)

池化层定义了对对象的降维操作。它的相关类定义在pooling_layer.cpp。参数设置prototxt中。

局部响应归一化层(LRN)

LRN全称是Local Response Normalization,相关的类定义在lrn_layer.cpp中,其参数定义在prototxt中。局部响应归一化层完成一种“临近抑制”操作,对局部输入区域进行归一化。本质上是防止激活函数饱和,能提升网络的泛化能力,将错误率降低。

local_size:两种表示

  • 通道间归一化时表示求和的通道数

  • 通道内归一化时表示求和区间的边长;默认值为5

alpha:缩放因子,默认值为1

beta:指数项,默认值为1

NormRegion:选择对相邻通道间归一化or通道内空间区域归一化,默认为ACROSS_CHANNELS。

在通道间归一化模式中,局部区域范围在相邻通道间,但没有空间扩展(即尺寸为local_size11);在通道内归一化模式中,局部区域在空间上扩展,但只针对独立通道进行(即尺寸为1local_sizelocal_size);每个输入值都将除以

全连接层(INNER_PRODUCT)

全连接层相关的类定义在inner_product_layer.cpp中,输出特征都是1*1的特征,参数定义在prototxt中。

Dropout层

Dropout层的相关类定义在dropout.cpp中,它的作用是防止过拟合和降低计算复杂度。

在实际训练中,每个节点都以相互独立的以p概率出现,实验证明p=0.5时在大规模网络中效果最优。

输出(分类)层(softmax)

相关类定义在softmax_lay,cpp中:

声明:本文为 CSDN 博主「.NY&XX」的原创文章,版权归作者所有,如需转载,请联系作者。

原文:https://blog.csdn.net/songguangfan/article/details/99436777

【END】

热 文 推 荐 

☞阿里拟 20 亿美元收购网易考拉;联通 5G 套餐最低 190 元;Rust 1.37.0 发布 | 极客头条

程序员上海租房指南

物联网开发平台大 PK,谁是最佳 Pick?

《乐队的夏天》很酷?程序员式的摇滚才燃爆了!

只需要支付0.5元就可以撤回交易?这下可坑苦DApp了……

从原理到代码,轻松深入逻辑回归模型!

@程序员,“10倍工程师”都在追这四大AI风向

常见的Hadoop十大应用误解

行!这下 CSDN 玩大了!粉丝:太良心

点击阅读原文,输入关键词,即可搜索您想要的 CSDN 文章。

你点的每个“在看”,我都认真当成了喜欢

一文了解 caffe 框架 | CSDN 博文精选相关推荐

  1. Java 8:一文掌握 Lambda 表达式 | CSDN 博文精选

    作者 | Android 大强哥 责编 | 郭芮 出品 | CSDN 博客 本文将介绍 Java 8 新增的 Lambda 表达式,包括 Lambda 表达式的常见用法以及方法引用的用法,并对 Lam ...

  2. 一文读懂GoogLeNet神经网络 | CSDN博文精选

    作者 | .NY&XX 来源 | CSDN博客 本文介绍的是著名的网络结构GoogLeNet,目的是试图领会其中结构设计思想. GoogLeNet特点 优化网络质量的生物学原理 GoogLeN ...

  3. 干货:NIST评测(SRE19)获胜团队声纹识别技术分析 | CSDN博文精选

    作者 | xjdier 来源 | CSDN博文精选 (*点击阅读原文,查看作者更多精彩文章) 近日,NIST说话人识别技术评测 (Speaker Recognition Evaluation,SRE) ...

  4. IntelliJ IDEA 2019.3 正式发布,给我们带来哪些新特性?| CSDN 博文精选

    作者 | _YourBatman 责编 | 屠敏 出品 | CSDN 博客 前言 千呼万唤始出来.自从JetBrains在今年7月24日发布了IDEA 2019.2版本后,从9月份开始我便一直在关注此 ...

  5. 利用MTCNN和FaceNet实现人脸检测和人脸识别 | CSDN博文精选

    作者 | pan_jinquan 来源 | CSDN博文精选 (*点击阅读原文,查看作者更多文章) 人脸检测和人脸识别技术算是目前人工智能方面应用最成熟的技术了.本博客将利用MTCNN和FaceNet ...

  6. 使用自己的数据集训练MobileNet、ResNet实现图像分类(TensorFlow)| CSDN博文精选

    作者 | pan_jinquan 来源 | CSDN博文精选 之前写了一篇博客<使用自己的数据集训练GoogLenet InceptionNet V1 V2 V3模型(TensorFlow)&g ...

  7. 万字长文详解如何用Python玩转OpenGL | CSDN 博文精选

    作者 | 天元浪子 来源 | CSDN博文精选 [编者按]OpenGL(开放式图形库),用于渲染 2D.3D 矢量图形的跨语言.跨平台的应用程序编程接口,C.C++.Python.Java等语言都能支 ...

  8. 云原生开发环境初探 | CSDN 博文精选

    作者 | 倚天码农 责编 | 屠敏 出品 | CSDN(ID:CSDNnews) 此前,我们分享了云原生的引申含义(https://blog.csdn.net/weixin_38748858/arti ...

  9. 贝塞尔曲线之爱心点赞代码全解析!| CSDN 博文精选

    作者 | 威威喵 责编 | 屠敏 出品 | CSDN 博客 直接步入正题,我们要实现的是一个 Android 客户端应用里面的一种点赞效果,比如你点一下那个爱心型的图片,就会产生一个小爱心,而且会以曲 ...

最新文章

  1. SPOJ problem 42: Adding Reversed Numbers
  2. Modbus通讯错误检测方法
  3. ABAP 锁对象与加锁机制
  4. odata.publish = true的CDS view激活之后,后台发生了什么事情
  5. docker镜像为什么要采用分层结构
  6. java多线程流式写入文件夹_java多线程写入同一文件
  7. 《Python Cookbook 3rd》笔记(2.3):用Shell通配符匹配字符串
  8. linux设置命令nmui,Linux网络配置及管理
  9. ES6的开发环境搭建
  10. jquery+css实现菜单收缩效果并适应多种浏览器与移动平台
  11. 项目连接DB2报错:必需的字符转换器不可用。 ERRORCODE=-4220, SQLSTATE=null
  12. MockServer 服务框架
  13. 正确认识和使用鲁班尺
  14. mybatis看这一篇就够了,简单全面一发入魂
  15. wordpress创建_您可以使用WordPress创建的19种网站类型
  16. 交易日九点到九点半的挂单撤单以及价格的一点心得
  17. 透彻理解BN(Batch Normalization)层
  18. 框架 --mybatis(ORM映射)-数据库技术
  19. 2019年特大喜讯,用Python爬出来的数据说话,房价真降了
  20. 为什么明明能上网,Windows却显示“无Internet”?

热门文章

  1. 利用ASP.NET一般处理程序动态生成Web图像
  2. 《编码规范和测试方法——C/C++版》作业 ·008——编写一个符合依赖倒置原则的简单学生管理系统
  3. int f()与int f(void)的区别
  4. 利用alpha matte提取图片前景
  5. Windows10 任务栏图标如何居中
  6. 在ubuntu安装使用miniconda
  7. *args, **kwargs
  8. 《统计学习方法》—— 感知机对偶算法、推导以及python3代码实现(二)
  9. lua的元表、模块和面向对象
  10. [SQL实战]之获取所有部门中当前员工薪水最高的相关信息