Deep Learning 论文笔记 (2): Neural network regularization via robust weight factorization
under review as a conference paper at ICLR 2015.
Motivation:
本文提出来一种regularization的方法,叫做FaMe (Factored Mean training). The proposed FaMe model aims to apply a similar strategy, yet learns a factorization of each weight matrix such that the factors are robust to noise.
具体做法如下:
Standard dropout hidden activation:
其中r^(l-1)是dropout noise。
FaMe hidden activation:
其中r^(l)也是noise,可以是dropout或者additive/multiplication Gaussian
唯一的区别在于把weight进行matrix factorization可以变成low rank:
一些问题:
说实话我没有太明白这个文章的motivation。除了做了一个Matrix factorization之外,基本上和standard dropout差不多。但是Standard dropout作为一种mask noise具有regularization的效果,按照作者自己在abstract里面陈述的,做factorization可以robust to noise。那么问题来了:
Q1:为什么会robust to noise?是因为low rank吗?noise对应eigenvalue非常小的eigenvector,现在low rank导致非常小的eigenvalue变成0,某种程度上有denoise的效果?
Q2:为什么需要robust to noise呢?就像我前面说的,dropout noise正是带来regularization效果的东东,是好的。如果robust to noise是Q1里面理解的那样,有denoise的效果,那为什么要把好的noise给去掉呢?
Q3:V和U这两个矩阵的参数怎么求的,我不是很清楚?作者说和standard的NN一样?
实验部分:
本文测试的dataset有MNIST, CIFAR-10. 从实验结果来看,效果并不明显。
转载于:https://www.cnblogs.com/yyuanad/p/4326649.html
Deep Learning 论文笔记 (2): Neural network regularization via robust weight factorization相关推荐
- Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
- Deep Learning论文笔记之(八)Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
- Deep Learning论文笔记之(七)深度网络高层特征可视化
Deep Learning论文笔记之(七)深度网络高层特征可视化 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感 ...
- Deep Learning论文笔记之(五)CNN卷积神经网络代码理解
Deep Learning论文笔记之(五)CNN卷积神经网络代码理解 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但 ...
- Deep Learning论文笔记之(一)K-means特征学习
Deep Learning论文笔记之(一)K-means特征学习 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感 ...
- Deep Learning论文笔记之(六)Multi-Stage多级架构分析
Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些 ...
- Deep Learning论文笔记之(三)单层非监督学习网络分析
Deep Learning论文笔记之(三)单层非监督学习网络分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感 ...
- Deep Learning论文笔记之(二)Sparse Filtering稀疏滤波
Deep Learning论文笔记之(二)Sparse Filtering稀疏滤波 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看 ...
- 【论文阅读】Recurrent Neural Network Regularization
本来是打算搜搜RNN或者LSTM的原文,结果arxiv上没搜到(求求,帮帮),然后就搜到知乎上一个回答: 心想完蛋,年份跨度比较远的论文读起来会不会很费劲啊.结果搜到LSTM的原论文了(论文链接:ht ...
最新文章
- 2022-2028年中国物联网金融产业深度调研及投资前景预测报告
- mysql数据库增删改实例_Mysql1:数据库表操作,增删改查举例
- Zend Framework Mail通过网易免费邮箱发送邮件
- web 服务器-Nginx
- 测试1111111111111111111
- Nginx+Lua(OpenResty) HelloWorld
- ExtJS学习:MVC模式案例(三)
- docker 查看容器_Docker介绍
- 日历签到 java_我的Android案例―签到日历
- 字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?
- oozie 调度pyspark
- Julia : |>的用法及多参数下的使用
- 计算机为啥启用不了网络发现,Win7“网络发现”功能启用不了的原因和解决方法...
- Oracle第二财季业绩表现抢眼 | 搜狗推出“唇语识别”技术 | FF宣布完成超10亿美元A轮融资
- java idwork长度_java 字符串id
- vmware 提示该虚拟机正在使用中
- EMAC和GMAC区别
- c语言输出字符的十六进制,用c语言输入键盘上的字符后转换成十六进制输出
- 新编日语第四册(修订版)第03课 应用文
- html引入本地css样式无效,vue在index.html里面引入css文件样式加载失败
热门文章
- 决策树构建算法之—C4.5
- Linux shell 操作命令 mkdir
- 喜欢←划,不喜欢→划
- freebsd镜像作用和vmware服务开启
- eclipse中Preferences的一些设置
- 用squid配置代理服务器(基于Ubuntu Server 12.04)
- kafka的四种checkpoint(没有整理完)
- 卷积神经网络VGG16权重数量的计算和理解(转载)
- codeblocks运行结果输出的对话框字体太小的问题
- 主体ubuntu16.04,宿体virtualbox下的windows7的共享文件夹设置