写在前面

今天讨论的论文依然是文本分类主题的。Character-level Convolutional Networks for Text Classification这篇论文是在2016年4月份发表的,在此之前,深度学习自然语言处理问题的处理思路基本都是基于单词或者短语(n-grams)。这篇文章作者受到 ImagineNet卷积神经网络处理图片从底层像素开始的思路影响,开始试图从字符角度出发重新训练神经网络。在此之前,作者团队在2015年也发表了相类似的文章(相似度85%)Text Understanding from Scratch。因此,神经网络不再需要提前输入关于单词的信息,并且这些单词的知识往往是高维的,很难应用于CNN中。除此之外,神经网络也不在需要提前知道关于语法和语义的只是。作者称这种基于字符的学习为从零开始学习(learn from scratch)。并且作者提到,这种学习策略很容易推广到所有语言。

模型框架

论文的实现框架就是由一个个模块堆砌成的,如下图所示:

1. Character quantization

这里的Character quantization就是将输入的每个字符用ont-hot编码表示出来。这里作者提出模型中使用的字母表一共包括70个字符,其中26个英文字母,10个数字,33个其他字符和一个全零向量(用于表示unknow字符)。另外处理输入的时候,作者选择反向处理字符编码,即反向读取文本,这样做的好处是最新读入的字符总是在输出最开始的地方。

abcdefghijklmnopqrstuvwxyz0123456789
-,;.!?:’’’/\|_@#$%ˆ&*˜‘+-=<>()[]{}

2. Conv. and Pool. layers

论文中设计了两种神经网络,一个大的一个小的。他们都有6个卷积层和3个全连接层总共9层,区别是卷基层通道的个数frame和全连接层神经元的个数。 论文中给出了大小两种模型详细的卷积层和全连接层的配置参数,卷积和池化的方式都采用“VALID”,即不进行补零操作。另外在全连接层中间还有两个dropout层,dropout的概率为0.5,以防止出现过拟合。权重初始化的方式为高斯分布,大模型的均值方差为(0,0.02),小模型的均值方差为(0,0.05)。

模型复现

https://github.com/KaiyuanGao/text_claasification/tree/master/char_cnn_classification

【论文复现】Character-level Convolutional Networks for Text Classification相关推荐

  1. Character-level Convolutional Networks for Text Classification

    论文总体结构 本文历史意义: 1.构建多个文本分类数据集,推动文本分类发展 2.提出CharTextCNN方法,由于只使用字符信息,所以可以用于多种语言中 一.Abstract(通过实验探究了字符级别 ...

  2. 论文阅读笔记:Graph Convolutional Networks for Text Classification

    Abstract 文本分类作为一个经典的自然语言处理任务,已经有很多利用卷积神经网络进行文本分类的研究,但是利用图卷积神经网络进行研究的仍然较少. 本文基于单词共现和文档单词间的关系构建一个text ...

  3. 【论文复现】Hierarchical Attention Networks for Document Classification

    写在前面 最近在整理文本分类方面比较经典的模型,看到了"Hierarchical Attention Networks for Document Classification"这篇 ...

  4. Character-level Convolutional Networks for Text Classification之每日一篇

    这篇文章发表于2016.04,作者还发表了一篇Text Unders tanding from Scratch的论文,有兴趣的可以去看看. 字符级的卷积网络是一个有效的方法. 模型如何很好地进行比较, ...

  5. 当GCN遇见NLP(三) Tensor Graph Convolutional Networks for Text Classification,AAAI2020

    文章目录 1.Introduction 2.Model 2.1 Graph Tensor 2.2 Text graph tensor construction Semantic-based graph ...

  6. Very Deep Convolutional Networks for Text Classification之每日一篇

    源码:https://github.com/lethienhoa/Very-Deep-Convolutional-Networks-for-Natural-Language-Processing 一: ...

  7. 【文本分类】Recurrent Convolutional Neural Networks for Text Classification

    ·摘要:   从模型的角度,本文作者将RNN(Bi-LSTM)和max_pooling结合使用,提出RCNN模型,应用到了NLP的文本分类任务中,提高了分类精度. ·参考文献:   [1] Recur ...

  8. PaddlePaddle飞桨论文复现营——3D Residual Networks for Action Recognition学习笔记

    PaddlePaddle飞桨论文复现营--3D Residual Networks for Action Recognition学习笔记 1 背景知识 1.1 C3D C3D是一种3D卷积提取视频特征 ...

  9. 【论文翻译】Fully Convolutional Networks for Semantic Segmentation_2

    论文题目:Fully Convolutional Networks for Semantic Segmentation 论文来源:Fully Convolutional Networks for Se ...

最新文章

  1. 追求极致的AI·OS——AI·OS引擎平台
  2. iOS进阶之底层原理-线程与进程、gcd
  3. 文巾解题 5. 最长回文子串
  4. nginx长连接出现504的解决办法
  5. 【数据库bug修复】——Authentication plugin ‘caching_sha2_password‘ is not supported
  6. 面向.NET开发人员的Dapr——服务调用
  7. C++ __gnu_pbds(hash,可并堆,平衡树)
  8. L2-007 家庭房产(并查集)
  9. 公共技术点之 Android 动画基础
  10. 趣学python编程教孩子学编程_趣学Python——教孩子学编程
  11. c语言病毒编写教程,来来来,教你一个用C语言写个小病毒
  12. 先学python还是r-r语言和python学哪个?
  13. 最新HyperSnap绿色汉化版
  14. 抖音起名号项目详细步骤拆分,不懂话术怎么办?
  15. html如何在背景的基础上添加文字,如何创建背景图片并在其上添加文字
  16. android夜景录像模式,【图片】三种夜景拍摄手法优缺点对比,仅供参考【android吧】_百度贴吧...
  17. 京东到家开放平台消息系统-进阶之路
  18. 小米笔记本第一排按键功能失灵 [ 解决办法 ]
  19. android 系统中将 键盘的esc键修改为 和back一样的功能
  20. CMD命令进入MySQL数据库的方法

热门文章

  1. SAP License:如何修改科目为为未清项目管理
  2. 数据工作者的福音:Google 发布正式版数据搜索工具啦!
  3. HTTP协议的请求与响应和CSS属性和定位
  4. 关于Java里try/catch/finally/有return时执行过程
  5. 为什么有些人看了别人的总结、经验、教训,依然没有用。
  6. json jackson
  7. struts2 s:property/标签的使用--输出时间格式转换
  8. Confluence 6 上传文件
  9. [BZOJ2958]序列染色
  10. !--more--搭建的博客设置主页内容高度