2020-05-28 18:07:49

文/编辑 | 言有三

好的模型结构是深度学习成功的关键因素之一,不仅是非常重要的学术研究方向,在工业界实践中也是模型是否能上线的关键。对各类底层深度学习模型设计和优化技术理解的深度是决定我们能否在深度学习项目中游刃有余的关键,因此我们在修行之路专栏的《不惑境界》中,着重于深入讲解主流的网络结构设计思想,包括对网络深度,宽度的理解,残差网络和分组网络的设计,多尺度与注意力机制的设计,以及深度学习模型压缩之模型剪枝,量化,蒸馏,还有AutoML技术,本次来给大家进行总结。

数据与人工智能技术发展

深度学习成功源于三驾马车,模型,数据和硬件,深度学习正是因为学会了从数据中抽象知识,才能够完成各种各样的任务。不知道什么样的数据能够完成手中的任务,就不算真正的入门深度学习。深度理解从有监督特征工程到无监督特征学习的进展,从学习特征,到学习模型,到学习整个系统的技术发展路线非常重要,我们一定要非常重视。

「AI不惑境」数据压榨有多狠,人工智能就有多成功

网络深度对模型的影响

深度学习模型之所以在各种任务中取得了成功,足够的网络深度当居首功。更深的模型意味着更好的非线性表达能力,可以学习更加复杂的变换,从而可以拟合更加复杂的特征输入。那么是不是模型越深,性能就越好呢?对这个问题,我们要认真思考。

「AI不惑境」网络深度对深度学习模型性能有什么影响?

网络宽度对模型的影响

在一定程度上,网络越深,性能越好,这一点同样适用于网络宽度,它指的是每一层的通道(channel)的数量。更宽的网络可以让每一层学习到更加丰富的特征,比如不同方向,不同频率的纹理特征。那越宽就一定越好吗?我们又该如何去平衡宽度和成平方量级增加的计算量问题。

「AI不惑境」网络的宽度如何影响深度学习模型的性能?

学习率和批处理大小

作为一对相互之间有紧密关系的模型优化相关因子,学习率和批处理大小(batchsize)对模型性能的影响有一些简单,但又有些神秘。不适当的参数往往让模型处于收敛与不收敛之间,但又可能对模型性能的影响非常微小。因此我们特意在这个系列中提起这个问题,希望引起大家的重视。

「AI不惑境」学习率和batchsize如何影响模型的性能?

残差网络原理和发展

在近几年的深度学习模型发展史中,残差网络是影响最大的模型,相信大家对此没有异议。残差网络因其简单而有效的结构解决了深层模型训练的难题,成为各类任务的基准模型,那么它缘起何处,又将走向何方?

「AI不惑境」残差网络的前世今生与原理

分组模型原理与发展

模型落地才是深度学习在工业界发挥作用的关键,在移动端高效的模型设计中,卷积拆分和分组几乎是不可缺少的思想,那么它们究竟是如何高效,本身又有哪些发展呢。

「AI不惑境」移动端高效网络,卷积拆分和分组的精髓

多尺度设计思想

多尺度可以说是图像处理领域中的精髓,实际上就是对信号的不同粒度的采样,在不同的尺度下我们可以观察到不同的特征,从而完成不同的任务。尺度始终是计算机视觉领域中的一个大问题,小物体与超大尺度物体往往都会严重影响性能,那么研究人员如何克服困难呢?

「AI不惑境」深度学习中的多尺度模型设计

注意力机制原理与设计

注意力机制(Attention)是聚焦于目标重要信息的处理机制,比如图像中的显著区域,是符合人类信息处理的机制。在计算机视觉,自然语言处理等领域中都发挥着重要的作用,那注意力机制都有哪些设计呢?

「AI不惑境」计算机视觉中注意力机制原理及其模型发展和应用

模型剪枝核心技术与展望

模型剪枝是一项历史非常悠久的模型压缩技术,当前已经有了比较大的进步和发展,那么当前模型剪枝的核心技术有哪些,发展现状如何,未来还可以做哪些工作呢?

【AI不惑境】模型剪枝技术原理及其发展现状和展望

模型量化核心技术与展望

模型量化是非常实用的模型压缩技术,当前已经在工业界发展比较成熟,那么当前模型量化的核心技术有哪些,发展现状如何,未来还可以做哪些工作呢?

「AI不惑境」模型量化技术原理及其发展现状和展望

模型蒸馏核心技术与展望

模型知识蒸馏是非常经典的基于迁移学习的模型压缩技术,在学术界的研究非常活跃,工业界也有许多的应用和较大的潜力,那么当前模型蒸馏的核心技术有哪些,发展现状如何,未来还可以做哪些工作呢?

「AI不惑境」模型压缩中知识蒸馏技术原理及其发展现状和展望

AutoML与模型设计和优化

自从2017年Google提出使用强化学习搜索模型结构之后,AutoML/NAS便迅速成为了学术界和工业界的宠儿,在这几年也是非常火热的领域。AutoML可以用于数据的使用,特征的选择,模型架构的设计和优化,优化参数的搜索等,现在发展究竟如何了呢?

「AI不惑境」AutoML在深度学习模型设计和优化中有哪些用处?

「完结」你对深度学习模型的理解是否足够深刻,这12篇文章了解下相关推荐

  1. 【完结】你对深度学习模型的理解是否足够深刻,这12篇文章可以作为一个参考...

    文/编辑 | 言有三 好的模型结构是深度学习成功的关键因素之一,不仅是非常重要的学术研究方向,在工业界实践中也是模型是否能上线的关键.对各类底层深度学习模型设计和优化技术理解的深度是决定我们能否在深度 ...

  2. 【完结】如何学习AutoML在模型优化中的应用,这12篇文章可以作为一个参考

    文/编辑 | 言有三 自动化机器学习技术是非常重要的基础研究,也是如今深度学习模型优化中的热点方向,我们开辟了一个专栏,专门讲解AutoML在深度学习模型优化中的一些重要思路,本次来给大家进行总结. ...

  3. 【杂谈】新手如何掌握深度学习模型?赠书2本,星球券10张

    对深度学习模型的理解贯穿整个项目的研发周期,目前模型的发展也从精度优先到速度优先,从结构优化到平台,系统优化,开始关注安全性,可拓展性等问题,那么如何系统性地掌握这些知识呢?下面汇总我们公众号的相关资 ...

  4. 用 Java 训练深度学习模型,原来这么简单

    作者 | DJL-Keerthan&Lanking 来源 | HelloGitHub 头图 | CSDN下载自东方IC 前言 很长时间以来,Java 都是一个很受企业欢迎的编程语言.得益于丰富 ...

  5. PyTorch学习系列教程:构建一个深度学习模型需要哪几步?

    导读 继续PyTorch学习系列.前篇介绍了PyTorch中最为基础也最为核心的数据结构--Tensor,有了这些基本概念即可开始深度学习实践了.本篇围绕这一话题,本着提纲挈领删繁就简的原则,从宏观上 ...

  6. 如何使用Keras和TensorFlow建立深度学习模型以预测员工留任率

    The author selected Girls Who Code to receive a donation as part of the Write for DOnations program. ...

  7. 模型加速:深度学习模型的硬件加速:NVIDIAT240

    作者:禅与计算机程序设计艺术 模型加速:深度学习模型的硬件加速:NVIDIA T240 在当前深度学习模型的规模和复杂度不断增加的情况下,硬件加速已经成为一个重要的技术手段.本文将介绍NVIDIA T ...

  8. 「AI不惑境」网络深度对深度学习模型性能有什么影响?

    https://www.toutiao.com/a6703349467061420557/ 大家好,这是专栏<AI不惑境>的第二篇文章,讲述模型深度与模型性能的关系. 进入到不惑境界,就是 ...

  9. 「完结」总结12大CNN主流模型架构设计思想

    http://blog.sina.com.cn/s/blog_cfa68e330102zocn.html 专栏<CNN模型解读>正式完结了,在这一个专栏中,我们给大家回顾了深度学习中的各类 ...

最新文章

  1. 单链表-插入一个元素为x的节点后,使链表仍然有序
  2. 百度:2020年十大科技趋势
  3. Linux中ifreq 结构体分析和使用
  4. jquery取值,赋值,以及下拉框获取选中value值
  5. Qt5:为窗口 创建工具栏 toobar
  6. 三种会计科目表:运营会计科目表、国家会计科目表、集团会计科目表
  7. Fashion-MNIST 一周年 | Google NIPS最爱,还登上了Science
  8. IP地址转化为数字,charindex ,SUBSTRING
  9. Nodejs是什么?
  10. sql server 入门_SQL Server查询调整入门
  11. Intellij idea创建maven项目并配置tomcat
  12. Java 线程——Timer TimerTask
  13. IOI flower
  14. 中国移动通信研究院笔试题2
  15. 计算机说课稿模板小学数学,小学数学优质说课稿模板
  16. Layabox的2d精灵的性能优化
  17. 基于Java怎么实现扫码登录
  18. 互联网公司愚人节策划大盘点,在恶搞界谁是老大?
  19. centos7 “v篇n“工具
  20. 双高教育建设与混合制校企合作

热门文章

  1. 常见的面试算法题:创建几个线程按顺序打印数字或者字母(多线程编程)(套用该模板即可)
  2. 集合框架一:Collection集合
  3. RPC实现MQ通信的一个小例子
  4. jupyter提示信息安装后正常OK的
  5. matplotlib绘制3维图
  6. Adaboost通俗易懂入门教程
  7. 下载 mysql 拖_mysql数据库托从
  8. PowerDesigner 连接MySQL数据库详细步骤
  9. 中国数学家在微分几何学领域取得重大突破
  10. JRuby:谁说鱼与熊掌不可兼得