2019/12/24论文小组交流
今天下午从两点一直开会到6点……emmmmmm,脑子都快宕机啦。赶紧趁还有一些记忆的时候记录一下,虽然记录的内容很简单,但是也还是有用的吧。
先祭出一张zxx师兄总结的10篇NAS方向的论文,码住待看。
Multinomial Distribution Learning for Effective Nueral Architecture Search
论文要点:将搜索空间看作一个联合多项式分布,进而提出一种多项式分布学习方法来提高NAS的效率。(They propose a Multinomial Distribution Learning for extremely effective NAS, which considers the search space as a joint multinomial distribution)
经验假设:训练神经网络时,若前期的神经网络表现较好,则该神经网络在后期的表现也会很好。如下图:
算法步骤:如下图:
1) 根据概率分布选择一个operation。
2) 通过前向和反向传播训练当前的网络。
3) 测试并记录当前网络在验证集上的表现。
4)根据提出的分布学习算法更新得到的分布参数。
思路创新:区别于传统的DARTS方法(我的理解就是relation啦,也是需要维护一套参数,不过要将每个参数和operation对应起来,一起参与计算),不用对每一个operation都进行一次计算。通过维护这个概率分布,每次前向和反向传播的时候,只要选择一个operation参与计算,然后根据一定的概率对其他的operation进行采样,如果随机采样获得的op表现比之前的更好,则更新当前的概率分布。这样可以大大减少需要的计算量。
NAT: Neural Architecture Transformer for Accurate and Compact Architectures
论文要点:该论文认为,即便是一个训练好的网络结构中也有冗余的模块(卷积或池化),这些冗余的模块不仅占用内存和计算资源,而且也拉低了模型的表现性能。因此,该论文采用增强学习的方法,将该优化问题映射成一个马尔可夫决策过程,通过学习一个Neural Architecture Transformer,将冗余的操作替换成更高效的skip或zero操作。
算法步骤:1) 训练一个大网络。 2) 在该大网络中选择一个operation,尝试优化。
思路创新:其他的都没怎么听懂。抓住的一个点就是,如下图一样。将一个operation(O)转化成skip(S)或者none(N)操作。貌似论文实际操作的过程中会先加一些操作啥啥的……看实验结果感觉可借鉴性不强,就记个下面的图就好。
Network Pruning via Transformable Architecture Search
论文要点:在不降低网络表现性能的情况下,不限制channel和layer大小(传统的方法都是有限制的),使用NAS来给网络进行剪枝。
算法步骤:
1) 训练未剪枝的大网络。
2) 通过论文中提出的TAS来搜索the depth and width of a small netwrok。
3) 用KD方法,将大网络中的知识转移至搜索得到的小网络中。
思路创新:
a) KD方法的使用。
b) 采用**Gumbel-Softmax**代替论文中不可导的简单softmax操作(?知识盲区,需要补齐)。
c) 不同情况下不同loss函数的设计。 在第2)步时,采用了增加的loss;在第3)步,用专用的KD loss。
Progressive Differentiable Architecture Search: Bridging the Depth Gap between Search and Evaluation
论文要点:可微分的搜索方法可以大幅降低NAS的计算消耗。然而,这些方法应用在评估结果或者transfer到其他数据集时,准确度总是很低。这是因为在搜索和评估场景下的结构深度存在large gap(???又是我的知识盲区,这句话在说啥???)。因此,作者提出了一种鉴定式的搜索过程,可以使搜索的结构在训练过程中逐渐加深。
算法步骤:
a) 去掉概率较小的operation。
b) 更新概率,叠加层,至收敛。
c) 重复几轮a)和b)阶段。【DARTS是一步选出所有的operation】
思路创新:大概就是,把原来一步就得到的结果变成几个阶段了?放慢了去掉operation的速度,来使模型训练的更准确?????
One-Shot Neural Architecture Search via Self-Evaluated Template Network
算法步骤:
a) 选择一个大网络作模板。
b) 在大网络中采样得一个小网络(即子网络)。
c) 设计一个评估器,评估生成的子网络,pass掉评估结果差的网络,提高效率。
思路要点:所有子网络共享参数。(???)
Auto-FPN: Automatic Network Architecture Adaptation for Object Detection Beyond Classification
思路要点:考虑searching a better fusion。
DetNAS: Backbone Search for Object Detection
算法步骤:
a) 在ImageNet数据集上预训练the one-shot supernet。
b) 在detection数据集上采用FPN结构,精调supernet。
c) 使用EA算法,在训练得到的supernet上进行结构搜索。【supernet本身非常复杂】
思路要点:考虑搜索Backbone。
Efficient Neural Architecture Transformation Search in Channel-Level for Object Detection
思路要点:采用了channel-level的operation,区别于path-level,channel-level的operation是针对图像某一区域的某一通道进行操作,同一区域不同channel可以有不同的filter操作,而path-level则对于同一区域所有channel都进行相同的操作。
AutoGAN: Neural Architecture Search for Generative Adversarial Networks
思路要点:该论文第一次尝试用NAS生成GAN。
2019/12/24论文小组交流相关推荐
- 百家号室内设计行业粉丝数量统计(2019.12.24)
百家号 粉丝 淄博设计师陈行知 18524 设计本室内设计 13008 室内设计姐 10248 室内设计全解 9303 叮当手绘 8395 家居室内设计 3903 室内设计案例赏析 3603 室内设计 ...
- 装修行业百家号粉丝量统计(2019.12.24)
百家号 粉丝 建房装修设计助手 253532 土巴兔装修家居 236397 韩胖拍装修 115274 装修大崔 91972 装修超人 81099 家居装修日记 75132 时代家居装修 59094 晒 ...
- 2019.12.24笔记——SpringBoot整合Elasticsearch及其使用
目录 Elasticsearch与springboot整合的方式 原生客户端 REST Jest Spring Data Spring Data的配置 Spring Data的使用 插入或修改数据 删 ...
- 棒棒糖-小学数学出题机v1.4.2【更新2019/12/26】
[推荐]2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 今年儿子刚上一年级,现在每天要做口算题,每次都要打印100题随机题目让他做,网上找了很多出题器,不是操作太繁琐 ...
- HCP Lab 12篇论文入选世界顶级计算机视觉会议 CVPR 2019
本文由中山大学人机物智能融合实验室(HCP Lab)特约供稿.全球计算机视觉三大顶会之一 CVPR 2019 (IEEE Conference on Computer Visionand Patter ...
- 两个大炸弹:清华大学医学院院长董晨院士回应“24篇论文质疑”;南开校长,曹雪涛团队12篇论文被正式调查“可信性”...
点击上方"视学算法",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:科研大匠 近日,学术圈一下来了两个大炸弹: 清华医学院院长董晨院士包括两篇Natu ...
- DayDayUp:2019.01.24新东方年会—俞敏洪点赞并奖励吐槽神曲《释放自我》12万元!—附全歌词(牛逼的人在哪里都不会彷徨)
DayDayUp:2019.01.24新东方年会-俞敏洪点赞并奖励员工的吐槽神曲<释放自我>12万元!-附全歌词 目录 新东方年会神曲亮了 官微回应:放手去做,未来可期! 各家吃瓜 < ...
- (九:2020.08.27)CVPR 2019 追踪之论文纲要(译)
CVPR 2019 追踪之论文纲要(修正于2020.08.28) 讲在前面 论文目录 讲在前面 论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自 ...
- 南开校长曹雪涛团队12篇论文被调查“可信性”,此前被举报实验图片有PS痕迹...
晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 南开大学校长曹雪涛院士团队的12篇论文被质疑"造假"事件,现在有了最新进展. 6月26日,核心学术期刊<生物化学 ...
最新文章
- usaco ★Subset Sums 集合
- java线程----生产者和消费者问题
- 动手学PaddlePaddle(4):MNIST(手写数字识别)
- 毕业设计论文选题系统系统用例图_基于Web的毕业论文管理系统的设计与实现
- springboot项目实例_Springboot项目的接口防刷的实例
- c语言leg 10,Leg massaging device
- 软件工作相关考试001---PMP等各种考试
- 用python生成一段关于文字的二维码(关于刷网课的)
- Netch游戏加速器自建(糖豆人Free就是研究的动力)
- maven详解_本地仓库+远程仓库_体现maven用途
- 向上滚动的文字的淡入淡出效果
- MapReduce----电信数据清洗
- c语言数值常量4.5e0,c语言数值常量表示方法问题
- Win7网络修复,winsock/tcpip
- linux下模拟登陆环境安装
- 程序员求职高峰期,这12条工作小技巧必看
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(8)
- 有人给你的长相“跑分”,有人给你的公司安全“跑分
- 第15届全国大学生知识竞赛 2022ciscn初赛 部分wp
- python助教酱酱有用吗_研究生生活总结(1):当助教的那些人和事
热门文章
- 通俗易懂的讲解二极管三极管工作原理
- 基于社交模型的权证交易概念产品-废话性前言
- java调用shell脚本,解决传参和权限问题
- 国家标准《信息技术 人工智能 知识图谱技术框架》第三次编辑会成功召开
- 计算机面试常见题目-网络
- django学习 | 实战 # 微信自定义菜单
- PhotoShop CS4快捷键大全
- test\fmw\gtest\include\gtest/gtest-printers.h(714) : error C2977: “std::tuple”: 模板 参数太多
- 对G1垃圾回收器的理解
- 计算机课艺术字四周型怎么弄,Word.文档中艺术字环绕方式四周型怎么设置