·阅读摘要:
  本文在Transformer模型的基础上,提出改进方案,把Transformer里面的自注意力机制,改成CNN。
·参考文献:
  [1] ACT: an Attentive Convolutional Transformer for Efficient Text Classification

【注】:众所周知,Transformer是超越RNNCNN的模型,Transformer中最有新意的就是不使用RNNCNN,而使用自注意力机制,从而使得Transformer模型表现卓越。
  而本文提出的ACT模型就是把Transformer中的自注意力机制替换成CNN,我觉得这篇论文是否有意义,其实应该和Transformer的作者battle一下,哈哈。

[1] ACT模型

  先看一下Transformer模型:

  再看ACT模型:

  所以说,ACT模型只是把TransformerScaled Dot-Product Attention模块换成了attentive convolution mechanism

  对于attentive convolution mechanism模块,主要就是CNN加了一个Global feature representation

【注】:说白了就是普通的CNN是卷积–>池化;而论文提出的CNN是卷积+池化,其中卷积部分称为提取局部信息,池化部分称为提取全局信息。

【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification相关推荐

  1. 【文本分类】Deep Pyramid Convolutional Neural Networks for Text Categorization

    ·阅读摘要:   本文提出了DPCNN(深度金字塔CNN)模型.在transformer.bert还没兴起的年代,模型越深效果越好,但是模型的复杂度会随着深度提升.粗略地说,DPCNN就是为了解决CN ...

  2. 【多标签文本分类】Initializing neural networks for hierarchical multi-label text classification

    ·阅读摘要:   本文在<Improved Neural Network-based Multi-label Classification with Better Initialization ...

  3. 【文本分类】Recurrent Convolutional Neural Networks for Text Classification

    ·摘要:   从模型的角度,本文作者将RNN(Bi-LSTM)和max_pooling结合使用,提出RCNN模型,应用到了NLP的文本分类任务中,提高了分类精度. ·参考文献:   [1] Recur ...

  4. 【2020-COLING】Regularized Graph Convolutional Networks for Short Text Classification 用于短文本分类的正则化图卷积网络

    文章目录 摘要 1 引言 2 提出的方法 3 图构建 3.1 产品查询分类PQC 3.2 4 实验和结果 5 结论 论文题目:Regularized Graph Convolutional Netwo ...

  5. Recurrent Convolutional Neural Networks for Text Classification(中文版)

    文章目录 用于文本分类的递归卷积神经网络 摘要 介绍 相关工作 文本分类 深度神经网络 模型 词表示学习 文本表示学习 训练 训练网络参数 预训练单词嵌入 实验 数据集 20Newsgroups 复旦 ...

  6. 自然语言处理NLP文本分类顶会论文阅读笔记(一)

    笔记目录 关于Transformer 小样本学习 BERT: Pre-training of Deep Bidirectional Transformers for Language Understa ...

  7. 文本分类模型(一)——RCNN

    文本分类模型(一) RCNN 文章目录 文本分类模型(一) RCNN 一.概述 二.背景 三.RCNN原理 3.1 模型结构 3.2 前向传播 1)Word Representation Learni ...

  8. python中文文本分析_基于CNN的中文文本分类算法(可应用于垃圾邮件过滤、情感分析等场景)...

    基于cnn的中文文本分类算法 简介 参考IMPLEMENTING A CNN FOR TEXT CLASSIFICATION IN TENSORFLOW实现的一个简单的卷积神经网络,用于中文文本分类任 ...

  9. 综述:基于深度学习的文本分类 --《Deep Learning Based Text Classification: A Comprehensive Review》总结(一)

    文章目录 综述:基于深度学习的文本分类 <Deep Learning Based Text Classification: A Comprehensive Review>论文总结(一) 总 ...

最新文章

  1. 关于学习Python的一点学习总结(12->字典相关操作)
  2. PyTorch | (1)初识PyTorch
  3. 算法导论之字符串匹配
  4. 手机协处理器java,HBase1.x实战:协处理器Java开发实例--ObserverCoprocessor
  5. 有序序列中的i个最大数(算法导论思考题9-1)
  6. 在windows 2008 R2上安装sharepoint 2013时遇到提示必须安装 .netframeword4.5的处理办法...
  7. wpf 控件生成图片_EyeshotCAD控件生成以及作用
  8. java 超构造函数_java中的超级构造函数
  9. 网易游戏java_2019秋招|网易游戏一面面经(Java开发)
  10. linux系统设置软连接
  11. XS128 中断向量表
  12. 【游戏测试】bug优先级的定义及如何描述
  13. k8s部署tomcat及web应用_k8s介绍 k8s搭建一个应用(mysql+tomcat)
  14. linux创建文件内容三行,Linux 文本处理三剑客
  15. 攻击重放技术以及什么是重放攻击?
  16. 设计模式学习难度系数排名
  17. 开发中常见的算法汇总之-基数排序
  18. win7共享xp打印机_快速有效的局域网共享方法,十年老技术现身说法亲测可用
  19. java 批量图片下载
  20. 掌财社寒山:快乐水不行了 快乐酒就能救可口可乐吗?

热门文章

  1. 【转】iTunes下载速度太慢?两招帮你提速!
  2. 语义分割算法Mask RCNN论文解读
  3. LabWindows CVI 2017开发笔记--常用API
  4. android 实现拨通震动,Android编程实现震动与振铃的方法详解
  5. 海康摄像头--通过WEB浏览器方式查看
  6. 正则表达式匹配非,以及非字符串的匹配
  7. Android开发之自定义View
  8. codemirror mysql_Codemirror简单配置
  9. 华为最新天才少年曝光!博士四年21篇论文
  10. 一级注册消防工程师备考解答:注册消防工程师好考吗?