转自:https://www.jiqizhixin.com/articles/7b1646c4-f9ae-4d5f-aa38-a6e5b42ec475  (如有版权问题,请联系本人)

目前绝大多数深度学习模型中的数学都是实数值的,近日,蒙特利尔大学、加拿大国家科学院-能源/材料/通信研究中心(INRS-EMT)、微软 Maluuba、Element AI 的多名研究者(其中包括 CIFAR Senior Fellow Yoshua Bengio)在 arXiv 上发布了一篇 NIPS 2017(今年 12 月在美国 Long Beach 举办)论文,提出了一种可用于复数值深度神经网络的关键组件,该团队也已经在 GitHub 上开源了相关研究代码。机器之心对本论文进行了摘要介绍。

  • 论文地址:https://arxiv.org/abs/1705.09792

  • 代码地址:https://github.com/ChihebTrabelsi/deep_complex_networks

论文:深度复数网络(Deep Complex Networks)

2.png

目前,深度学习的绝大多数构建模块、技术和架构都基于实数值的运算和表征。但是,近来在循环神经网络和其它更古老的基础理论上的分析表明复数可以有更加丰富的表征能力,也可以促进对噪声鲁棒的记忆检索机制。尽管它们在带来全新的神经架构上有引人注目的性质和潜力,但由于缺少设计这种模型所需的构建模块,复数值的深度神经网络一直处于边缘化的状态。在这项研究中,我们提供了可用于复数值深度神经网络的关键基本组件,并将它们应用到了卷积前馈网络中。更准确地说,我们依靠复数卷积,提出了可用于复数值深度神经网络的复数批规范化、复数权重初始化策略,并且我们还在端到端的训练方案中对它们进行了实验。我们表明,这样的复数值模型可以实现与其对应的实数值模型相媲美或更好的表现。我们在一些计算机视觉任务和使用 MusicNet 数据集的音乐转录任务上对深度复数模型进行了测试,实现了当前最佳的表现。

1 引言

本论文的贡献如下:

  1. 对复数批规范化(complex batch normalization)进行了形式化,详见 3.4 节;

  2. 复数权重初始化,详见 3.5 节;

  3. 在多乐器音乐转录数据集(MusicNet)上达到了当前最佳的结果,详见 4.2 节。

3 复数构建模块

在这一节,我们给出了我们研究成果的核心,为实现复数值的深度神经网络构建模块制定了数学框架。

3.png

图 1:复数卷积和残差网络实现细节

3.1 复数的表征

3.2 复数卷积

3.3 深度复数网络的深度和宽度

3.4 复数批规范化

3.5 复数权重初始化

3.6 复数卷积残差网络

4 实验结果

在这一节,我们给出了我们的模型在图像和音乐分类任务上的实验结果。首先,我们给出了我们的模型架构,然后给出了其在三个标准图像分类基准(CIFAR-10、CIFAR-100 和 SVHN)上的结果,另外还有在 MusicNet 基准上的自动音乐转录结果。

4.1 图像识别

4.png

表 1:模型架构。S1、S2 和 S3 Filters 分别是指在 stage 1、2 和 3 每一层所使用的卷积滤波器的数量。(S) 表示小网络,(L) 表示大网络。

5.png

表 2:在 CIFAR-10、CIFAR-100 和 SVHN 上的分类误差。注意 He et al. [2016] 使用了 110 层的模型

6.png

图 3:(a) 作为每次输入的实数和虚数对的 Stage 1 特征图;(b) 作为幅度和相的特征图

7.png

图 4:作为每次输入的实数和虚数对的 Stage 2 和 3 特征图

4.2 在 MusicNet 数据集上的自动音乐转录

image.png

表 3:MusicNet 实验。FS 表示采样率。Params 是参数的总数量。我们给出了平均精度(AP)指标,是指精度召回曲线(precision-recall curve)下的面积。

图片1.png

图 5:精度召回曲线

By me:

3.1 Representation of Complex Numbers

N feature maps such that N is divisible by 2;

Allocate the first N/2 feature maps to represent the real components and the remaining N/2 to represent the imaginary ones.

Four dimensional weight tensor W that links Nin input feature maps to Nout output feature maps and whose kernel size is m × m.

have a weight tensor of size (Nout × Nin × m × m) /2 complex weights

3.2 Complex Convolution

complex filter matrix W = A + iB;

complex vector h = x + iy

W ∗ h = (A ∗ x − B ∗ y) + i(B ∗ x + A ∗ y).

use matrix notation to represent it:

3.3 Depth and Width in Deep Complex Networks

For a given layer, the number of parameters for each of the real and imaginary weights would be equal to N/2 × N/2 which means N2/2  when we sum both.

For a real-valued layer, it is N2.

假设一共有L层,那么实数值的参数是复数值的 (√ 2 )2L倍。

3.4 Complex Batch Normalization

未完待续。。。

转载于:https://www.cnblogs.com/skykill/p/7067684.html

深度复数网络 Deep Complex Networks相关推荐

  1. 深度信念网络Deep Belief Networks资料汇总

    毕设做的是DBNs的相关研究,翻过一些资料,在此做个汇总. 可以通过谷歌学术搜索来下载这些论文. Arel, I., Rose, D. C. and K arnowski, T. P. Deep ma ...

  2. 【机器学习网络】神经网络与深度学习-6 深度神经网络(deep neural Networks DNN)

    目录 深度神经网络(deep neural Networks DNN) DNN的底层原理 深度学习网络的问题: 案例1:书写数字识别(梯度下降法详解) 男女头发长短区分案例(为什么隐藏层追求深度): ...

  3. 花书+吴恩达深度学习(十六)序列模型之双向循环网络 BRNN 和深度循环网络 Deep RNN

    目录 0. 前言 1. 双向循环网络 BRNN(Bidirectional RNN) 2. 深度循环网络 Deep RNN 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~ 花 ...

  4. 深度残差网络 - Deep Residual Learning for Image Recognition

    CVPR2016 code: https://github.com/KaimingHe/deep-residual-networks 针对CNN网络深度问题,本文提出了一个叫深度残差学习网络,可以使得 ...

  5. 深度残差网络(Deep Residual Network)ResNet

    一说起"深度学习",自然就联想到它非常显著的特点"深.深.深",通过很深层次的网络实现准确率非常高的图像识别.语音识别等能力.因此,我们自然很容易就想到:深的网 ...

  6. 理解深度神经网络——DNN(Deep Neural Networks)

    深度神经网络--DNN 是深度学习的基础. 要理解DNN最好先搞清楚它的模型.本篇博文主要对DNN的模型与前向传播算法做一个易于理解的总结. 1.从感知机到神经网络的理解. 感知机是这么一种模型:一个 ...

  7. 【文献学习】 2021 Deep-Waveform: A Learned OFDM Receiver Based on Deep Complex Convolutional Networks

    2018版 https://arxiv.org/abs/1810.07181 2018译文 参考文章 参考文章 深波:一种基于深复卷积网络的学习OFDM接收机: V 结果评估 OFDM系统和衰落信道配 ...

  8. 深度学习--深度信念网络(Deep Belief Network)

    本篇非常简要地介绍了深度信念网络的基本概念.文章先简要介绍了深度信念网络(包括其应用实例).接着分别讲述了:(1) 其基本组成结构--受限玻尔兹曼机的的基本情况,以及,(2) 这个基本结构如何组成深度 ...

  9. 论文翻译:2020_DCCRN: Deep Complex Convolution Recurrent Network for Phase-Aware Speech Enhancement...

    论文地址:DCCRN:用于相位感知语音增强的深度复杂卷积循环网络 论文代码:https://paperswithcode.com/paper/dccrn-deep-complex-convolutio ...

  10. Deep Complex Convolution Recurrent Network(DCCRN模型)

    Abstract 深度学习给语音增强带来很多益处,传统的时频域(TF)方法主要通过朴素卷积神经网络(CNN)或递归神经网络(RNN)预测TF掩码或语音频谱.一些研究将将复值谱图作为训练目标,在实值网络 ...

最新文章

  1. 八、H.264中的熵编码基本方法、指数哥伦布编码
  2. 网络推广专员浅析网络推广中如何分析网站建设水平孰优孰劣?
  3. 大学计算机演示文稿作业,(大学计算机作业.doc
  4. Mybase到期 破解
  5. 一个半月快速、低成本上云,云数据库专属集群解决方案看过来
  6. 第八篇:Spring Boot整合Thymeleaf_入门试炼04
  7. 一键换ip命令_软网推荐:高效命令行备份更简单
  8. php 转通达信数据格式,通达信数据格式
  9. sql 按照天环比_SQL 求同比 环比
  10. 【error】 in ./api/axios.js Module parse failed: Unexpected token
  11. LM393实现简易PWM调压电路
  12. spssfisher判别分析步骤_在SPSS中进行Fisher判别分析的具体操作及研究意义——【杏花开医学统计】...
  13. 计算机本地连接无internet访问权限,Win7本地连接IPV4无访问权限怎么解决?
  14. 计算机科学美国大学专业,最新!2019年USNews美国大学计算机专业排名
  15. 互联网公司的完整开发流程是怎样的?
  16. OOP Class具体解释
  17. 朴素贝叶斯以及它的三个模型
  18. edusrc教育src漏洞平台
  19. [Music]30首经典萨克斯名曲
  20. iOS开发者对苹果公司发起集体诉讼 指控其违反竞争法

热门文章

  1. vue 项目实现短信发送
  2. 智慧医疗管理系统解决方案:医药电商系统实现智能化改造
  3. boost之lexical_cast使用
  4. php人人商城定时任务,人人商城异步操作菜单示例
  5. c语言 逻辑 与或非
  6. 纯干货:手把手地教你搭建Oracle Sharding数据库分片技术
  7. 图的应用:骑士周游问题
  8. 玩转电脑常用的140个技巧
  9. 集合框架ArrayList 源码分析(二)
  10. 三台Centos7虚拟机之间实现ssh,rsh互连,虚拟机和本机基于ssh进行文件传输