最近梳理了一下卷积神经网络设计相关的论文(这个repo现在只列出了最重要的一些论文,后面会持续补充):

Neural network architecture design​github.com


1. Handcrafted

1.1 Efficient

  • [1608.08021] PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection
  • [1610.02357] Xception: Deep Learning with Depthwise Separable Convolutions
  • [1612.08242] YOLO9000: Better, Faster, Stronger
  • [1704.04861] MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
  • [1707.01083] ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices
  • [1708.05234] FaceBoxes: A CPU Real-time Face Detector with High Accuracy
  • [1711.07264] Light-Head R-CNN: In Defense of Two-Stage Object Detector
  • [1801.04381] MobileNetV2: Inverted Residuals and Linear Bottlenecks
  • [1803.10615] SqueezeNext: Hardware-Aware Neural Network Design
  • [1807.11164] ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

1.2 High accuracy

  • [2012] ImageNet Classification with Deep Convolutional Neural Networks
  • [1409.1556] Very Deep Convolutional Networks for Large-Scale Image Recognition
  • [1409.4842] Going Deeper with Convolutions
  • [1512.00567] Rethinking the Inception Architecture for Computer Vision
  • [1512.03385] Deep Residual Learning for Image Recognition
  • [1602.07261] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning
  • [1603.05027] Identity Mappings in Deep Residual Networks
  • [1608.06993] Densely Connected Convolutional Networks
  • [1804.02767] YOLOv3: An Incremental Improvement

2. Automated

  • [1707.07012] Learning Transferable Architectures for Scalable Image Recognition
  • [1807.11626] MnasNet: Platform-Aware Neural Architecture Search for Mobile
  • [1812.00332] ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware
  • [1812.03443] FBNet: Hardware-Aware Efficient ConvNet Design via Differentiable Neural Architecture Search
  • [1812.08934] ChamNet: Towards Efficient Network Design through Platform-Aware Model Adaptation

3. Useful component

  • [1502.03167] Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
  • [1603.05201] Understanding and Improving Convolutional Neural Networks via Concatenated Rectified Linear Units # CReLU
  • [1709.01507] Squeeze-and-Excitation Networks # SE
  • [1708.02002] Focal Loss for Dense Object Detection

4. Activation function

  • [1502.01852] Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification # PReLU

5. Weight initialization

  • [2018] Residual Learning Without Normalization via Better Initialization # ZeroInit

感觉每做一个子方向,最好还是要适时做一些梳理和总结,一方面方便日后查阅,另一方面梳理和总结的过程能够进一步加深对这个问题的认识。在做梳理的过程中,我越发觉得网络自动设计的重要性。

18年12月份arxiv上一下多了三篇网络自动设计的文章,感觉后面网络自动设计的相关论文应该会越来越多。不同的业务场景和硬件环境对神经网络的需求不一样,几乎没有一个神经网络可以“一招鲜,吃遍天”,一般情况都会针对不同业务场景和硬件环境专门设计神经网络

早期的时候业务场景比较少、硬件环境也比较单一,全靠人工设计也未尝不可。但是随着人工智能的发展,业务场景会越来越多,硬件环境也越来越多样。如果全靠人力来设计神经网络,成本会越来越高,神经网络设计的自动化是一个必然的趋势

就像资讯网站早期的时候,向所有用户推荐一样的资讯,早期用户量不大,人工找到大家兴趣点的最大公约数还比较容易,随着用户量越来越大,用户兴趣点的公约数越来越难找,甚至几乎没有,既然找不到公约数,那干脆千人千面好了,但是人工要做到千人千面需要极大的成本,这个时候基于推荐的资讯APP应运而生。

这个过程也像图像特征子的发展历程一样,早期通过手工设计特征子,例如SIFT、HOG、LBP、Haar等等,设计有效的特征子很难,只有少部分对这个领域有着很深理解的人才有这个能力;后面深度学习横空出世,深度卷积神经网络通过自学习特征子,学出来的特征子在大多数任务中都比手工设计的特征子好用。而且每当我们训练一个模型,其实就设计出来了一套特征子,虽然我们自己都没意识到。

以后网络自动设计成熟后,我们每运行一下网络自动设计程序,就会设计出一个新的神经网络结构。到那个时候,神经网络结构的设计就会如同现在的特征子的设计一样,在你训练一个模型的过程中,程序就自动帮你设计了一个最合适的神经网络结构

sift论文_卷积神经网络设计相关论文相关推荐

  1. DeepLearning | 图卷积神经网络(GCN)解析(论文、算法、代码)

    本篇博客主要讲述三种图卷积网络(Graph Convolutional Network, GCN)的算法原理及python实现,全文阅读时间约10分钟. 博主关于图神经网络的文章 DeepLearni ...

  2. 计算机网络相关的课程设计题目,计算机网络课程设计专业论文题目 计算机网络课程设计专业论文题目怎么拟...

    汇总了[100道]与计算机网络课程设计相关论文选题,为广大毕业生和职称者推荐计算机网络课程设计专业论文题目,解决在校大学生不知道计算机网络课程设计专业论文题目怎么拟等相关问题! 一.比较好写的计算机网 ...

  3. 联邦学习激励机制设计相关论文研究问题对比

    联邦学习激励机制设计相关论文研究问题对比 An Incentive Mechanism for Cross-silo Federated Learning: A Public Goods Perspe ...

  4. vgg16卷积层的计算量_卷积神经网络VGG16参数数量的计算和理解

    先说一下我对神经网络的理解:神经网络就是用巨量的简单的非线性函数组合起来拟合复杂的未知函数.比如,人类识别不同的物体.识别不同动物.不同植物是个复杂的未知函数.虽然未知,但没事,我们的神经网络可以用巨 ...

  5. 94页论文综述卷积神经网络:从基础技术到研究前景

    点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 选自arXiv 机器之心编译 参与:Panda 卷积神经网络(CNN)在计算机视觉领域 ...

  6. 博士论文——基于卷积神经网络的人脸识别研究 __张燕红

    论文题目 作者 年份 关键词 链接 备注 基于卷积神经网络的人脸识别研究 张燕红 2018 人脸识别:卷积神经网络:特征提取:分块策略:正则化 博士论文 摘要:随着信息技术的蓬勃发展,人们的学习和生活 ...

  7. 卷积层数据放大_卷积神经网络重要回顾

    上世纪60年代,Hubel等人通过对猫视觉皮层细胞的研究,提出了感受野这个概念,到80年代,Fukushima在感受野概念的基础之上提出了神经认知机的概念,可以看作是卷积神经网络的第一个实现网络,神经 ...

  8. [CVPR2019]:专门为卷积神经网络设计的训练方法:RePr

    作者 | ywsun 论文链接 | https://arxiv.org/abs/1811.07275 原文地址 | https://zhuanlan.zhihu.com/p/58095683 加入** ...

  9. cnn卷积神经网络_卷积神经网络(CNN)原理及应用

    一.CNN原理 卷积神经网络(CNN)主要是用于图像识别领域,它指的是一类网络,而不是某一种,其包含很多不同种结构的网络.不同的网络结构通常表现会不一样.从CNN的一些典型结构中,可以看到这些网络创造 ...

最新文章

  1. 【驱动】GPIO寄存器配置总结
  2. arping 帮助——翻译
  3. Apache下如何禁止指定目录运行PHP脚本
  4. 部署用于生产的Exceptionlees(一个强大易用的日志收集服务)
  5. Spring IoC?看这篇文章就够了...
  6. Java中switch参数传null会引起异常——Java 语法糖
  7. 全球开发者调查:JavaScript 成最爱,还最喜欢用 React
  8. c++字符串加密_【网络爬虫教学】快速定位拼多多加密算法入口(四)
  9. 【主成分分析法】NLPer的断舍离(上篇)
  10. AdventNet Agent Toolkit C Edition6 AGENT
  11. MIDAS分布应用程序中的几个问题
  12. 获取屏幕分辨率和刷新率
  13. _CRT_SECURE_NO_DEPRECATE
  14. Hutool Java常用工具类汇总
  15. 小苹果蹿红背后的网络营销思考
  16. 流媒体服务器(17)—— 流媒体开源服务 MediaSoup 初识
  17. 现在手机千篇一律,下一个乔布斯的传奇在哪?
  18. 多卡聚合路由器在智能可视化指挥调度的应用方案
  19. 2009年“五一”假期市民旅游指南
  20. 计算机最优配置,2019年度电脑配置最优选择,这些CPU、显卡、SSD不容错过!

热门文章

  1. 关于Activity class {package/class} does not exist
  2. COLLATE 函数
  3. 机器学习入门(12)— 激活函数层 ReLU、Sigmoid 层的实现
  4. 第一段冲刺_个人总结_5.2
  5. usaco Stringsobits
  6. 图像变换——等距变换,相似变换,仿射变换,投影变换
  7. python找工作学历_第一学历和最高学历,哪一个对找工作帮助更大?
  8. php上传图片到文件夹,2018.09.14PHP获取页面上传的图片存到指定文件夹再存到数据库中...
  9. oracle怎么adi导入,Web adi 导入笔记 详细图解
  10. java 变量的线程可见性_Java多线程——变量可见性