under review as a conference paper at ICLR 2015.

Motivation

本文提出来一种regularization的方法,叫做FaMe (Factored Mean training). The proposed FaMe model aims to apply a similar strategy, yet learns a factorization of each weight matrix such that the factors are robust to noise.

具体做法如下:

Standard dropout hidden activation:

其中r^(l-1)是dropout noise。

FaMe hidden activation:

其中r^(l)也是noise,可以是dropout或者additive/multiplication Gaussian

唯一的区别在于把weight进行matrix factorization可以变成low rank:

一些问题:

说实话我没有太明白这个文章的motivation。除了做了一个Matrix factorization之外,基本上和standard dropout差不多。但是Standard dropout作为一种mask noise具有regularization的效果,按照作者自己在abstract里面陈述的,做factorization可以robust to noise。那么问题来了:

Q1:为什么会robust to noise?是因为low rank吗?noise对应eigenvalue非常小的eigenvector,现在low rank导致非常小的eigenvalue变成0,某种程度上有denoise的效果?

Q2:为什么需要robust to noise呢?就像我前面说的,dropout noise正是带来regularization效果的东东,是好的。如果robust to noise是Q1里面理解的那样,有denoise的效果,那为什么要把好的noise给去掉呢?

Q3:V和U这两个矩阵的参数怎么求的,我不是很清楚?作者说和standard的NN一样?

实验部分:

本文测试的dataset有MNIST, CIFAR-10. 从实验结果来看,效果并不明显。

转载于:https://www.cnblogs.com/yyuanad/p/4326649.html

Deep Learning 论文笔记 (2): Neural network regularization via robust weight factorization相关推荐

  1. Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现

    Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文, ...

  2. Deep Learning论文笔记之(八)Deep Learning最新综述

    Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...

  3. Deep Learning论文笔记之(七)深度网络高层特征可视化

    Deep Learning论文笔记之(七)深度网络高层特征可视化 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但老感 ...

  4. Deep Learning论文笔记之(五)CNN卷积神经网络代码理解

    Deep Learning论文笔记之(五)CNN卷积神经网络代码理解 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但 ...

  5. Deep Learning论文笔记之(一)K-means特征学习

    Deep Learning论文笔记之(一)K-means特征学习 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但老感 ...

  6. Deep Learning论文笔记之(六)Multi-Stage多级架构分析

    Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些 ...

  7. Deep Learning论文笔记之(三)单层非监督学习网络分析

    Deep Learning论文笔记之(三)单层非监督学习网络分析 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但老感 ...

  8. Deep Learning论文笔记之(二)Sparse Filtering稀疏滤波

    Deep Learning论文笔记之(二)Sparse Filtering稀疏滤波 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看 ...

  9. 【论文阅读】Recurrent Neural Network Regularization

    本来是打算搜搜RNN或者LSTM的原文,结果arxiv上没搜到(求求,帮帮),然后就搜到知乎上一个回答: 心想完蛋,年份跨度比较远的论文读起来会不会很费劲啊.结果搜到LSTM的原论文了(论文链接:ht ...

最新文章

  1. 2022-2028年中国物联网金融产业深度调研及投资前景预测报告
  2. mysql数据库增删改实例_Mysql1:数据库表操作,增删改查举例
  3. Zend Framework Mail通过网易免费邮箱发送邮件
  4. web 服务器-Nginx
  5. 测试1111111111111111111
  6. Nginx+Lua(OpenResty) HelloWorld
  7. ExtJS学习:MVC模式案例(三)
  8. docker 查看容器_Docker介绍
  9. 日历签到 java_我的Android案例―签到日历
  10. 字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?
  11. oozie 调度pyspark
  12. Julia : |>的用法及多参数下的使用
  13. 计算机为啥启用不了网络发现,Win7“网络发现”功能启用不了的原因和解决方法...
  14. Oracle第二财季业绩表现抢眼 | 搜狗推出“唇语识别”技术 | FF宣布完成超10亿美元A轮融资
  15. java idwork长度_java 字符串id
  16. vmware 提示该虚拟机正在使用中
  17. EMAC和GMAC区别
  18. c语言输出字符的十六进制,用c语言输入键盘上的字符后转换成十六进制输出
  19. 新编日语第四册(修订版)第03课 应用文
  20. html引入本地css样式无效,vue在index.html里面引入css文件样式加载失败

热门文章

  1. 决策树构建算法之—C4.5
  2. Linux shell 操作命令 mkdir
  3. 喜欢←划,不喜欢→划
  4. freebsd镜像作用和vmware服务开启
  5. eclipse中Preferences的一些设置
  6. 用squid配置代理服务器(基于Ubuntu Server 12.04)
  7. kafka的四种checkpoint(没有整理完)
  8. 卷积神经网络VGG16权重数量的计算和理解(转载)
  9. codeblocks运行结果输出的对话框字体太小的问题
  10. 主体ubuntu16.04,宿体virtualbox下的windows7的共享文件夹设置