1、 dlib::input

模板类,深度神经网络的简单输入层,它将某种图像作为输入并将其加载到网络中。
这是一个基本的输入层,它只是简单地将图像复制到一个张量中。
注意:dlib::input只支持输入dlib::matrix和dlib::array2d类型,并且它们的像素类型必须是合法的,eg:必须存在 pixel_traits<T::type>

以dlib::matrix为例:
原型:

template <typename T, long NR, long NC, typename MM, typename L>
class input<matrix<T,NR,NC,MM,L>>

主要成员函数说明:

template <typename forward_iterator>
void to_tensor ( forward_iterator ibegin, forward_iterator iend, resizable_tensor& data ) const

说明:
将图像数据转换成张量并保存到data变量中。假定图像有R行、C列和K个通道,则图像数据和张量的对应关系如下

  - #data.num_samples() == std::distance(ibegin,iend)  //std::distance计算迭代器之间的距离(第一个和最后一个元素之间的个数)- #data.nr() == R- #data.nc() == C- #data.k() == K

例如:

  matrix<float,3,3>转换成张量tensor是3行、3列、1通道;matrix<rgb_pixel,4,5> 转换成张量tensor是4行、5列、3通道;std::array<matrix<float,3,3>,5> 转换成张量tensor是3行、3列、5通道;

注意,如果matrix的像素类型是unsigned char、rgb_pixel或者以unsigned char为basic_pixel_type的其它像素类型,会将张量中的值都除外256,即值在[0,1]返回内。

2、dlib::input_rgb_image

和dlib::input相似,它将RGB图像作为输入并将其加载到网络中。并且在将图像转换为张量时从每个颜色通道中减去平均颜色值(对图片进行预处理,零均值化(zero-mean) / 中心化)。

3、dlib::input_rgb_image_sized

该层具有与input_rgb_image相同的接口和行为, 除了它要求输入图像具有特定大小(指定NR行和NC列)。还可以通过复制构造或赋值在input_rgb_image和input_rgb_image_size之间进行转换。
原型:

template <size_t NR, size_t NC=NR>
class input_rgb_image_sized

该层主要成员变量:

float avg_red;
float avg_green;
float avg_blue;

可以通过构造函数设置:input_rgb_image_sized (float avg_red_, float avg_green_, float avg_blue_)

默认参数打印:layer<131> input_rgb_image_sized(122.782,117.001,104.298) nr=50 nc=50

4、dlib::input_layer

模板函数,获取网络的输入层。
原型:

template <typename net_type>
auto& input_layer (net_type& net);
5、dlib::input_tensor_to_output_tensor

原型:

template <typename net_type>
dpoint input_tensor_to_output_tensor(const net_type& net, dpoint p);

说明:
给定网络net和输入张量中的dpoint(即行、列坐标),该函数返回输出张量网络中相应的dpoint。
这种映射在处理全卷积网络时非常有用,可以获取输入和对应的输出特征映射。
如果网络包含跳跃层,那么在计算这个坐标映射时,跳跃层跳过的任何层都将被忽略。
也就是说,如果您将网络从输出层走到输入层,每当您遇到一个跳跃层时,您都会跳到跳跃层所指示的层,您将访问所涉及的网络中的各个层
这种行为是有用的,因为它允许您计算一些辅助DNN作为一个单独的计算分支,独立于主网络在图像上运行某种全卷积网络的工作。例如,您可能希望在网络中有一个分支来计算一些全局图像级别的摘要/特性。

6、dlib::input_rgb_image_pyramid

原型:

template <typename PYRAMID_TYPE>
class input_rgb_image_pyramid

说明:
此输入层使用matrix<rgb_pixel>类型的RGB图像。它与input_rgb_image相同,只是它输出的张量包含每个输入图像的平铺图像金字塔(参见create_tiled_pyramid),而不是每个图像的简单副本。
该输入层旨在与诸如MMOD loss layer的损耗层一起使用。

【Dlib】dlib实现深度网络学习之 input层相关推荐

  1. 深度网络学习调研报告

     深度网络学习调研报告 目录 1.前言...............................................3 1.1课题研究的背景及意义................. ...

  2. Stanford UFLDL教程 深度网络概览

    深度网络概览 Contents [hide] 1概述 2深度网络的优势 3训练深度网络的困难 3.1数据获取问题 3.2局部极值问题 3.3梯度弥散问题 4逐层贪婪训练方法 4.1数据获取 4.2更好 ...

  3. 学习笔记1 - ResNet网络学习

    一些概念知识学习: 端到端(end-to-end):指的是输入是原始数据,输出是最后结果. 非端到端的输入端不是直接的原始数据,而是在原始数据中提取的特征.在以前是由手工提取图像的一些关键特征,称为降 ...

  4. deep learning 从自我学习到深层网络学习

    概述: 第二节我们已经构建了一个包括输入层.隐藏层以及输出层的三层神经网络,分别是一层自学习层和一层softmax学习层.虽然该网络对于MNIST手写数字数据库非常有效,但是它还是一个非常" ...

  5. 多智能体深度强化学习综述与批判——Matthew E. Taylor

    这篇综述是华盛顿大学的Matthew E. Taylor总结的,"A Survey and Critique of Multiagent Deep Reinforcement Learnin ...

  6. 【深度学习】深度神经网络框架的INPUT PROCESS

    [深度学习]深度神经网络框架的INPUT PROCESS 文章目录 1 概述 2 批量生成训练数据2.1 如何实现2.2 实验验证2.3 图片标注并生成训练所需文件 3 数据增强 4 目标检测中的图像 ...

  7. 深度学习(二十三)Maxout网络学习-ICML 2013

    Maxout网络学习 原文地址:http://blog.csdn.net/hjimce/article/details/50414467 作者:hjimce 一.相关理论 本篇博文主要讲解2013年, ...

  8. 【深度学习】【积分梯度】深度网络的公理归因(Axiomatic Attribution for Deep Networks)

    深度网络的公理归因 Axiomatic Attribution for Deep Networks 相关博客 [自然语言处理][可解释性]NKB:用于预训练Transformers的神经知识银行 [自 ...

  9. 深度学习(二十三)Maxout网络学习

    Maxout网络学习 原文地址:http://blog.csdn.net/hjimce/article/details/50414467 作者:hjimce 一.相关理论 本篇博文主要讲解2013年, ...

最新文章

  1. Eureka与zookeeper
  2. 基于深度学习的脑电图识别 综述篇(二)数据采样及处理
  3. Nexus入门【转】
  4. 洛谷 4115 Qtree4——链分治
  5. hssfcolor 不建议使用_不建议使用微信双开的真正原因!
  6. 百度宣布架构调整,BAT要在To B业务重开一局
  7. 【Elasticsearch】Elasticsearch 动态模板(Dynamic templates)
  8. python代码示例-《Python编程:从入门到实践》DEMO实例代码
  9. 有道词典 DIY 离线版
  10. 物联网终端安全系列(之四) -- 终端安全方案之SIM卡篇
  11. 艾永亮:永远也说不清作用的保健品凭什么卖了千年?
  12. 深度学习之跟学霹雳吧啦Wz笔记
  13. 【Pygamre实战】2023人气超高的模拟经营类游戏:梦想小镇代码版火爆全场,免费体验分享下载哦~
  14. AppleID的双重认证
  15. RIP实验步骤(RNA Immunoprecipitation)
  16. 踩坑-填坑之 : vue打包上线,页面无法显示
  17. python地铁查询系统_基于图结构实现地铁乘坐线路查询
  18. 进阶技术 - 如何实现跨进程传递大图?(腾讯面试题)
  19. 银河英雄传说 解题报告
  20. JVA核心类库随堂笔记

热门文章

  1. MXNET源码中TShape值的获取和打印
  2. 【图像分类案例】(1) ResNeXt 交通标志四分类,附Tensorflow完整代码
  3. Matlab实现图像边缘检测
  4. 机器学习——模型测试与评估方法与指标
  5. SSC:基于点云语义上下文的大规模激光SLAM的位置识别方法
  6. 在Ubuntu 14.04 64bit上安装CHM阅读器KchmViewer 5.3
  7. 使用Cumulus和Flash Player搭建视频会议示例
  8. BitCask 持久化hash存储引擎 原理介绍
  9. Linux下查看Nginx,tomcat等的并发连接数和连接状态
  10. java中decimalFormat格式化数值