深度复数网络 Deep Complex Networks

转自：https://www.jiqizhixin.com/articles/7b1646c4-f9ae-4d5f-aa38-a6e5b42ec475 （如有版权问题，请联系本人）

目前绝大多数深度学习模型中的数学都是实数值的，近日，蒙特利尔大学、加拿大国家科学院-能源/材料/通信研究中心（INRS-EMT）、微软 Maluuba、Element AI 的多名研究者（其中包括 CIFAR Senior Fellow Yoshua Bengio）在 arXiv 上发布了一篇 NIPS 2017（今年 12 月在美国 Long Beach 举办）论文，提出了一种可用于复数值深度神经网络的关键组件，该团队也已经在 GitHub 上开源了相关研究代码。机器之心对本论文进行了摘要介绍。

论文地址：https://arxiv.org/abs/1705.09792
代码地址：https://github.com/ChihebTrabelsi/deep_complex_networks

论文：深度复数网络（Deep Complex Networks）

目前，深度学习的绝大多数构建模块、技术和架构都基于实数值的运算和表征。但是，近来在循环神经网络和其它更古老的基础理论上的分析表明复数可以有更加丰富的表征能力，也可以促进对噪声鲁棒的记忆检索机制。尽管它们在带来全新的神经架构上有引人注目的性质和潜力，但由于缺少设计这种模型所需的构建模块，复数值的深度神经网络一直处于边缘化的状态。在这项研究中，我们提供了可用于复数值深度神经网络的关键基本组件，并将它们应用到了卷积前馈网络中。更准确地说，我们依靠复数卷积，提出了可用于复数值深度神经网络的复数批规范化、复数权重初始化策略，并且我们还在端到端的训练方案中对它们进行了实验。我们表明，这样的复数值模型可以实现与其对应的实数值模型相媲美或更好的表现。我们在一些计算机视觉任务和使用 MusicNet 数据集的音乐转录任务上对深度复数模型进行了测试，实现了当前最佳的表现。

1 引言

本论文的贡献如下：

对复数批规范化（complex batch normalization）进行了形式化，详见 3.4 节；
复数权重初始化，详见 3.5 节；
在多乐器音乐转录数据集（MusicNet）上达到了当前最佳的结果，详见 4.2 节。

3 复数构建模块

在这一节，我们给出了我们研究成果的核心，为实现复数值的深度神经网络构建模块制定了数学框架。

图 1：复数卷积和残差网络实现细节

3.1 复数的表征

3.2 复数卷积

3.3 深度复数网络的深度和宽度

3.4 复数批规范化

3.5 复数权重初始化

3.6 复数卷积残差网络

4 实验结果

在这一节，我们给出了我们的模型在图像和音乐分类任务上的实验结果。首先，我们给出了我们的模型架构，然后给出了其在三个标准图像分类基准（CIFAR-10、CIFAR-100 和 SVHN）上的结果，另外还有在 MusicNet 基准上的自动音乐转录结果。

4.1 图像识别

表 1：模型架构。S1、S2 和 S3 Filters 分别是指在 stage 1、2 和 3 每一层所使用的卷积滤波器的数量。(S) 表示小网络，(L) 表示大网络。

表 2：在 CIFAR-10、CIFAR-100 和 SVHN 上的分类误差。注意 He et al. [2016] 使用了 110 层的模型

图 3：(a) 作为每次输入的实数和虚数对的 Stage 1 特征图；(b) 作为幅度和相的特征图

图 4：作为每次输入的实数和虚数对的 Stage 2 和 3 特征图

4.2 在 MusicNet 数据集上的自动音乐转录

表 3：MusicNet 实验。FS 表示采样率。Params 是参数的总数量。我们给出了平均精度（AP）指标，是指精度召回曲线（precision-recall curve）下的面积。

图片1.png

图 5：精度召回曲线

By me：

3.1 Representation of Complex Numbers

N feature maps such that N is divisible by 2;

Allocate the first N/2 feature maps to represent the real components and the remaining N/2 to represent the imaginary ones.

Four dimensional weight tensor W that links N_in input feature maps to N_out output feature maps and whose kernel size is m × m.

have a weight tensor of size (N_out × N_in × m × m) /2 complex weights

3.2 Complex Convolution

complex filter matrix W = A + iB;

complex vector h = x + iy

W ∗ h = (A ∗ x − B ∗ y) + i(B ∗ x + A ∗ y).

use matrix notation to represent it:

3.3 Depth and Width in Deep Complex Networks

For a given layer, the number of parameters for each of the real and imaginary weights would be equal to N/2 × N/2 which means N²/2 when we sum both.

For a real-valued layer, it is N².

假设一共有L层，那么实数值的参数是复数值的（√ 2 ）^2L倍。

3.4 Complex Batch Normalization

未完待续。。。

转载于:https://www.cnblogs.com/skykill/p/7067684.html

深度复数网络 Deep Complex Networks相关推荐

深度信念网络Deep Belief Networks资料汇总
毕设做的是DBNs的相关研究,翻过一些资料,在此做个汇总. 可以通过谷歌学术搜索来下载这些论文. Arel, I., Rose, D. C. and K arnowski, T. P. Deep ma ...
【机器学习网络】神经网络与深度学习-6 深度神经网络（deep neural Networks DNN）
目录深度神经网络(deep neural Networks DNN) DNN的底层原理深度学习网络的问题: 案例1:书写数字识别(梯度下降法详解) 男女头发长短区分案例(为什么隐藏层追求深度): ...
花书+吴恩达深度学习（十六）序列模型之双向循环网络 BRNN 和深度循环网络 Deep RNN
目录 0. 前言 1. 双向循环网络 BRNN(Bidirectional RNN) 2. 深度循环网络 Deep RNN 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~ 花 ...
深度残差网络 - Deep Residual Learning for Image Recognition
CVPR2016 code: https://github.com/KaimingHe/deep-residual-networks 针对CNN网络深度问题,本文提出了一个叫深度残差学习网络,可以使得 ...
深度残差网络(Deep Residual Network)ResNet
一说起"深度学习",自然就联想到它非常显著的特点"深.深.深",通过很深层次的网络实现准确率非常高的图像识别.语音识别等能力.因此,我们自然很容易就想到:深的网 ...
理解深度神经网络——DNN(Deep Neural Networks)
深度神经网络--DNN 是深度学习的基础. 要理解DNN最好先搞清楚它的模型.本篇博文主要对DNN的模型与前向传播算法做一个易于理解的总结. 1.从感知机到神经网络的理解. 感知机是这么一种模型:一个 ...
【文献学习】 2021 Deep-Waveform: A Learned OFDM Receiver Based on Deep Complex Convolutional Networks
2018版 https://arxiv.org/abs/1810.07181 2018译文参考文章参考文章深波:一种基于深复卷积网络的学习OFDM接收机: V 结果评估 OFDM系统和衰落信道配 ...
深度学习--深度信念网络（Deep Belief Network）
本篇非常简要地介绍了深度信念网络的基本概念.文章先简要介绍了深度信念网络(包括其应用实例).接着分别讲述了:(1) 其基本组成结构--受限玻尔兹曼机的的基本情况,以及,(2) 这个基本结构如何组成深度 ...
论文翻译：2020_DCCRN: Deep Complex Convolution Recurrent Network for Phase-Aware Speech Enhancement...
论文地址:DCCRN:用于相位感知语音增强的深度复杂卷积循环网络论文代码:https://paperswithcode.com/paper/dccrn-deep-complex-convolutio ...
Deep Complex Convolution Recurrent Network(DCCRN模型)
Abstract 深度学习给语音增强带来很多益处,传统的时频域(TF)方法主要通过朴素卷积神经网络(CNN)或递归神经网络(RNN)预测TF掩码或语音频谱.一些研究将将复值谱图作为训练目标,在实值网络 ...

深度复数网络 Deep Complex Networks

论文：深度复数网络（Deep Complex Networks）

深度复数网络 Deep Complex Networks相关推荐

最新文章

热门文章