今天下午从两点一直开会到6点……emmmmmm,脑子都快宕机啦。赶紧趁还有一些记忆的时候记录一下,虽然记录的内容很简单,但是也还是有用的吧。

先祭出一张zxx师兄总结的10篇NAS方向的论文,码住待看。

Multinomial Distribution Learning for Effective Nueral Architecture Search

论文要点:将搜索空间看作一个联合多项式分布,进而提出一种多项式分布学习方法来提高NAS的效率。(They propose a Multinomial Distribution Learning for extremely effective NAS, which considers the search space as a joint multinomial distribution)

经验假设:训练神经网络时,若前期的神经网络表现较好,则该神经网络在后期的表现也会很好。如下图:

算法步骤:如下图:

1) 根据概率分布选择一个operation。
2) 通过前向和反向传播训练当前的网络。
3) 测试并记录当前网络在验证集上的表现。
4)根据提出的分布学习算法更新得到的分布参数。

思路创新:区别于传统的DARTS方法(我的理解就是relation啦,也是需要维护一套参数,不过要将每个参数和operation对应起来,一起参与计算),不用对每一个operation都进行一次计算。通过维护这个概率分布,每次前向和反向传播的时候,只要选择一个operation参与计算,然后根据一定的概率对其他的operation进行采样,如果随机采样获得的op表现比之前的更好,则更新当前的概率分布。这样可以大大减少需要的计算量。

NAT: Neural Architecture Transformer for Accurate and Compact Architectures

论文要点:该论文认为,即便是一个训练好的网络结构中也有冗余的模块(卷积或池化),这些冗余的模块不仅占用内存和计算资源,而且也拉低了模型的表现性能。因此,该论文采用增强学习的方法,将该优化问题映射成一个马尔可夫决策过程,通过学习一个Neural Architecture Transformer,将冗余的操作替换成更高效的skip或zero操作。

算法步骤:1) 训练一个大网络。 2) 在该大网络中选择一个operation,尝试优化。

思路创新:其他的都没怎么听懂。抓住的一个点就是,如下图一样。将一个operation(O)转化成skip(S)或者none(N)操作。貌似论文实际操作的过程中会先加一些操作啥啥的……看实验结果感觉可借鉴性不强,就记个下面的图就好。

Network Pruning via Transformable Architecture Search

论文要点:在不降低网络表现性能的情况下,不限制channel和layer大小(传统的方法都是有限制的),使用NAS来给网络进行剪枝。

算法步骤

1) 训练未剪枝的大网络。
2) 通过论文中提出的TAS来搜索the depth and width of a small netwrok。
3) 用KD方法,将大网络中的知识转移至搜索得到的小网络中。

思路创新

a) KD方法的使用。
b) 采用**Gumbel-Softmax**代替论文中不可导的简单softmax操作(?知识盲区,需要补齐)。
c) 不同情况下不同loss函数的设计。 在第2)步时,采用了增加的loss;在第3)步,用专用的KD loss。

Progressive Differentiable Architecture Search: Bridging the Depth Gap between Search and Evaluation

论文要点:可微分的搜索方法可以大幅降低NAS的计算消耗。然而,这些方法应用在评估结果或者transfer到其他数据集时,准确度总是很低。这是因为在搜索和评估场景下的结构深度存在large gap(???又是我的知识盲区,这句话在说啥???)。因此,作者提出了一种鉴定式的搜索过程,可以使搜索的结构在训练过程中逐渐加深。

算法步骤

a) 去掉概率较小的operation。
b) 更新概率,叠加层,至收敛。
c) 重复几轮a)和b)阶段。【DARTS是一步选出所有的operation】

思路创新:大概就是,把原来一步就得到的结果变成几个阶段了?放慢了去掉operation的速度,来使模型训练的更准确?????

One-Shot Neural Architecture Search via Self-Evaluated Template Network


算法步骤

a) 选择一个大网络作模板。
b) 在大网络中采样得一个小网络(即子网络)。
c) 设计一个评估器,评估生成的子网络,pass掉评估结果差的网络,提高效率。

思路要点:所有子网络共享参数。(???)

Auto-FPN: Automatic Network Architecture Adaptation for Object Detection Beyond Classification


思路要点:考虑searching a better fusion。

DetNAS: Backbone Search for Object Detection

算法步骤


a) 在ImageNet数据集上预训练the one-shot supernet。
b) 在detection数据集上采用FPN结构,精调supernet。
c) 使用EA算法,在训练得到的supernet上进行结构搜索。【supernet本身非常复杂】

思路要点:考虑搜索Backbone。

Efficient Neural Architecture Transformation Search in Channel-Level for Object Detection

思路要点:采用了channel-level的operation,区别于path-level,channel-level的operation是针对图像某一区域的某一通道进行操作,同一区域不同channel可以有不同的filter操作,而path-level则对于同一区域所有channel都进行相同的操作。

AutoGAN: Neural Architecture Search for Generative Adversarial Networks


思路要点:该论文第一次尝试用NAS生成GAN。

2019/12/24论文小组交流相关推荐

  1. 百家号室内设计行业粉丝数量统计(2019.12.24)

    百家号 粉丝 淄博设计师陈行知 18524 设计本室内设计 13008 室内设计姐 10248 室内设计全解 9303 叮当手绘 8395 家居室内设计 3903 室内设计案例赏析 3603 室内设计 ...

  2. 装修行业百家号粉丝量统计(2019.12.24)

    百家号 粉丝 建房装修设计助手 253532 土巴兔装修家居 236397 韩胖拍装修 115274 装修大崔 91972 装修超人 81099 家居装修日记 75132 时代家居装修 59094 晒 ...

  3. 2019.12.24笔记——SpringBoot整合Elasticsearch及其使用

    目录 Elasticsearch与springboot整合的方式 原生客户端 REST Jest Spring Data Spring Data的配置 Spring Data的使用 插入或修改数据 删 ...

  4. 棒棒糖-小学数学出题机v1.4.2【更新2019/12/26】

    [推荐]2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 今年儿子刚上一年级,现在每天要做口算题,每次都要打印100题随机题目让他做,网上找了很多出题器,不是操作太繁琐 ...

  5. HCP Lab 12篇论文入选世界顶级计算机视觉会议 CVPR 2019

    本文由中山大学人机物智能融合实验室(HCP Lab)特约供稿.全球计算机视觉三大顶会之一 CVPR 2019 (IEEE Conference on Computer Visionand Patter ...

  6. 两个大炸弹:清华大学医学院院长董晨院士回应“24篇论文质疑”;南开校长,曹雪涛团队12篇论文被正式调查“可信性”...

    点击上方"视学算法",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:科研大匠 近日,学术圈一下来了两个大炸弹: 清华医学院院长董晨院士包括两篇Natu ...

  7. DayDayUp:2019.01.24新东方年会—俞敏洪点赞并奖励吐槽神曲《释放自我》12万元!—附全歌词(牛逼的人在哪里都不会彷徨)

    DayDayUp:2019.01.24新东方年会-俞敏洪点赞并奖励员工的吐槽神曲<释放自我>12万元!-附全歌词 目录 新东方年会神曲亮了 官微回应:放手去做,未来可期! 各家吃瓜 < ...

  8. (九:2020.08.27)CVPR 2019 追踪之论文纲要(译)

    CVPR 2019 追踪之论文纲要(修正于2020.08.28) 讲在前面 论文目录 讲在前面 论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自 ...

  9. 南开校长曹雪涛团队12篇论文被调查“可信性”,此前被举报实验图片有PS痕迹...

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 南开大学校长曹雪涛院士团队的12篇论文被质疑"造假"事件,现在有了最新进展. 6月26日,核心学术期刊<生物化学 ...

最新文章

  1. usaco ★Subset Sums 集合
  2. java线程----生产者和消费者问题
  3. 动手学PaddlePaddle(4):MNIST(手写数字识别)
  4. 毕业设计论文选题系统系统用例图_基于Web的毕业论文管理系统的设计与实现
  5. springboot项目实例_Springboot项目的接口防刷的实例
  6. c语言leg 10,Leg massaging device
  7. 软件工作相关考试001---PMP等各种考试
  8. 用python生成一段关于文字的二维码(关于刷网课的)
  9. Netch游戏加速器自建(糖豆人Free就是研究的动力)
  10. maven详解_本地仓库+远程仓库_体现maven用途
  11. 向上滚动的文字的淡入淡出效果
  12. MapReduce----电信数据清洗
  13. c语言数值常量4.5e0,c语言数值常量表示方法问题
  14. Win7网络修复,winsock/tcpip
  15. linux下模拟登陆环境安装
  16. 程序员求职高峰期,这12条工作小技巧必看
  17. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(8)
  18. 有人给你的长相“跑分”,有人给你的公司安全“跑分
  19. 第15届全国大学生知识竞赛 2022ciscn初赛 部分wp
  20. python助教酱酱有用吗_研究生生活总结(1):当助教的那些人和事

热门文章

  1. 通俗易懂的讲解二极管三极管工作原理
  2. 基于社交模型的权证交易概念产品-废话性前言
  3. java调用shell脚本,解决传参和权限问题
  4. 国家标准《信息技术 人工智能 知识图谱技术框架》第三次编辑会成功召开
  5. 计算机面试常见题目-网络
  6. django学习 | 实战 # 微信自定义菜单
  7. PhotoShop CS4快捷键大全
  8. test\fmw\gtest\include\gtest/gtest-printers.h(714) : error C2977: “std::tuple”: 模板 参数太多
  9. 对G1垃圾回收器的理解
  10. 计算机课艺术字四周型怎么弄,Word.文档中艺术字环绕方式四周型怎么设置