论文信息

A Survey on Dynamic Neural Networks for Natural Language Processing

发表单位:University of California, San Diego

作者:Canwen Xu, Julian McAuley

发表会议: EACL 2023

论文地址:http://arxiv.org/abs/2202.07101

发布时间:2022.2.15(v1) 2023.2.24 (v2)

ABs

掌握主要内容

  1. 有效缩小大型Transformer模型是自然语言处理最新进展的主要趋势;

  2. 动态神经网络作为一个新兴的研究方向,能够通过根据输入动态调整其计算路径,在计算和时间上以亚线性增加的方式缩小神经网络。动态神经网络可能是预训练语言模型参数数量不断增长的有前途的解决方法,既允许使用数万亿个参数进行模型预训练,又可以在移动设备上更快地推理。

  3. 本综述总结了NLP三种动态神经网络的类型:skimming, mixture of experts, early exit,列举当前面临的挑战以及未来研究的方向。

1. INTRO

研究背景

1)NLP模型不断增大的计算复杂度和内存消耗,难以用于训练和使用;

2)不需要所有输入案例分配相同的计算资源。

【论文阅读】A Survey on Dynamic Neural Networks for Natural Language Processing相关推荐

  1. [论文解读] Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey

    Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey 文章目录 Adversaria ...

  2. 【Gaze】A Survey on Using Gaze Behaviour for Natural Language Processing

    A Survey on Using Gaze Behaviour for Natural Language Processing 1. Abstract 摘要中主要介绍本文的工作,整篇主要讨论了在NL ...

  3. 论文-阅读理解-Adversary Resistant Deep Neural Networks with an Application to Malware Detection

    整体来说,Adversary Resistant DeepNeural Networks with an Application to Malware Detection 这篇论文是利用了生成对抗网络 ...

  4. 论文阅读--PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection

    为什么80%的码农都做不了架构师?>>>    论文地址:https://arxiv.org/abs/1608.08021 算法实现:https://github.com/Charl ...

  5. 图神经网络论文阅读(十六) GraLSP: Graph Neural Networks with Local Structural Patterns,AAAI 2020

    本文作者来自香港科技大学.北大和北邮,其中包含宋国杰老师和石川老师,这两位都是国内研究图表示学习的翘楚了.之前读石川团队论文的时候自己犯傻发邮件问了一个比较弱智的问题,石川老师还是让学生耐心帮我解答了 ...

  6. 论文阅读笔记《Fine-tuning Deep Neural Networks in Continuous Learning Scenarios》

    摘要:深度神经网络的复兴与ImageNet数据集的公开为近期复杂识别任务的成功奠定了基础.然而,ImageNet并不能包含所有可能的应用场景的所有视觉概念.因此,应用科学家仍然不断地记录新的数据,并期 ...

  7. 【论文阅读笔记】BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translati

    BART:去噪序列到序列的预训练自然语言生成.翻译和理解 动力 自监督方法在广泛的NLP任务中取得了显著的成功.最成功的方法是masked language model的变体去噪的自编码器.训练去噪的 ...

  8. 综述论文阅读”A comprehensive survey on graph neural networks“(TNNLS2020)

    论文标题 A comprehensive survey on graph neural networks 论文作者.链接 作者:Wu, Zonghan and Pan, Shirui and Chen ...

  9. [论文翻译]-A Comprehensive Survey on Graph Neural Networks《图神经网络GNN综述》

    文章目录 摘要 1 简介 1.1 GNN简史 1.2 Related surveys on graph neural networks 1.3 Graph neural networks vs. ne ...

最新文章

  1. 最新版OpenWrt编译教程,解决依赖问题
  2. 加载Loader.bin
  3. UA MATH574M 统计学习I 监督学习理论
  4. opencv利用矩形框选中某一区域_【从零学习OpenCV】4Ubuntu系统中安装OpenCV 4
  5. 异动分析技术解决方案—异动归因之指标拆解
  6. jquery-本地存储-cookie插件
  7. 包邮送50本畅销书,涵盖数据库、Python、机器学习等!
  8. xshell对mysql的备份与恢复_windows下mysql全备份及还原(亲测可用)
  9. 谈ISO9000-3内容及其与CMM关系
  10. 销售自用计算机损益计入哪里,用友创业者4.0下的ERP沙盘模拟经营规则中,销售所需紧急采购产品时,按成品直接成本的(    )倍直接扣除现金,付款即到货,紧急采购多付出的成本计入费用表损失项。...
  11. win10桌面新建|解压文件夹不自动显示|需要自动刷新
  12. 在一个局域网中,共享的项目别人访问不了,解决方法
  13. LearnOpenCV学习——平均脸
  14. shc/unshc工具用于加/解密shell脚本
  15. 从零开始学习UCOSII操作系统13--系统移植理论篇
  16. RationalDMIS 7.1 DMIS基本语句
  17. 学java被“劝退”的第五天
  18. 剪刀石头布二(ptwo) 时限:1s 空间:256m
  19. 计算机软件卸载不了怎么办,软件卸载不了,教您软件卸载不了怎么办
  20. python中init和属性_python类的属性不在\uyu init中__

热门文章

  1. 素描为什么是一切绘画的基础?素描关系你了解吗?
  2. MySql安装出现3306端口!解决方法亲测成功
  3. PHP 实现定时任务的几种方法
  4. 九宫格红绿灯到底是不是新规?交通信号灯到底该如何识别?
  5. PLC的一般技术规格
  6. 2021年终总结-----收获、相遇、向前
  7. mjpeg视频传输和人脸识别
  8. 中企动力携手河南卫特解锁网络营销新模式
  9. GOM SCAN TRITOP Professional ATOS Professional GOM Inspect Professional 2016/2018/2020/2021
  10. python通信工程定额_版 通信工程费用及定额套用解读