什么是Convolutional Neural Network(卷积神经网络)?

  最早应该是LeCun(1998)年论文提出,其结果如下:运用于手写数字识别。详细就不介绍,可参考zouxy09的专栏,主要关注convolution、pooling,个人理解是这样的,convolution是做特征检测,得到多个feature maps,而pooling是对特征进行筛选,提取关键信息,过滤掉一些噪音,另一方面是减少训练参数。

Single Layer CNN

  与图像处理不同,对于自然语言处理任务来说,输入一般是用矩阵表示的句子或文档。对于句子矩阵,每一行表示一个单词,每个词可以用向量表示(word2vec or GloVe, but they could also be one-hot vectors)。下面介绍一种简单的cnn结构,一层convolution+一层pooling。来自Yoon Kim(2014)的论文。

  该CNN很简单,共分四层,

  第一层是词向量层,doc中的每个词,都将其映射到词向量空间,假设词向量为k维,则n个词映射后,相当于生成一张n*k维的图像;

  第二层是卷积层,多个滤波器作用于词向量层,不同滤波器生成不同的feature map;

  第三层是pooling层,取每个feature map的最大值,这样操作可以处理变长文档,因为第三层输出只依赖于滤波器的个数;

  第四层是一个全连接的softmax层,输出是每个类目的概率。除此之外,输入层可以有两个channel,其中一个channel采用预先利用word2vec训练好的词向量,另一个channel的词向量可以通过backpropagation在训练过程中调整。

  这样做的结果是:在目前通用的7个分类评测任务中,有4个取得了state-of-the-art的结果,另外3个表现接近最好水平。

  首先做一些符号说明:输入是词向量Xi(长度是k),句子向量Xi:n是词向量的级联(拼接成长向量),filter是w,可看成一个滑动窗口,这里的w是向量,长度是hk(滑动窗口包含h个词)。

  Convolution:卷积操作,f是激活函数,ci表示卷积得到的特征。通过滑动filter w,与句子所有词进行卷积,可得到feature map 

  

  Pooling:使用max-pooling获得feature map中最大的值,然后使用多个filter获得不同n-grams的特征。

  Multi-Channel:这里很有意思,输入句子时,使用两个通道(channel,可以认为是输入copy一份),都用word2vec初始化,其中一个词的向量保持不变(static),另一个是non-static,在BP过程不断修改,最后再pooling前对两个通道得到的卷积特征进行累加。

  Classification:通过pooling,得到句子最后的特征向量,然后直接用softmax进行分类。

转载于:https://www.cnblogs.com/zeze/p/8253124.html

【论文笔记】CNN for NLP相关推荐

  1. 论文笔记 | CNN 是怎么学到图片绝对位置信息的

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 来自 | 知乎 作者丨Xinlong Wang 昨天读到一篇挺有意 ...

  2. cnn 回归 坐标 特征图_论文笔记 | CNN 是怎么学到图片绝对位置信息的

    来自 | 知乎作者丨Xinlong Wang来源丨https://zhuanlan.zhihu.com/p/99766566编辑 | 深度学习这件小事仅作学术交流,如有侵权,请联系删文 昨天读到一篇挺 ...

  3. GAN for NLP (论文笔记及解读

    GAN 自从被提出以来,就广受大家的关注,尤其是在计算机视觉领域引起了很大的反响."深度解读:GAN模型及其在2016年度的进展"[1]一文对过去一年GAN的进展做了详细介绍,十分 ...

  4. NLP论文笔记合集(持续更新)

    NLP论文笔记合集(持续更新) 经典论文 参考文献 情感分析论文 关键词 综述 参考文献 非综述 参考文献 其他论文 参考文献 经典论文 2003年发表的文章1^11,NLP经典论文:NNLM 笔记 ...

  5. Deep Learning论文笔记之(五)CNN卷积神经网络代码理解

    Deep Learning论文笔记之(五)CNN卷积神经网络代码理解 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但 ...

  6. Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现

    Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文, ...

  7. 【论文笔记 2】CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET

    [论文笔记 2]CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET 1. 综述 对现代的CNN网络结构进行了简要说明,一般的网络都是由卷 ...

  8. 论文笔记:CLIP:Learning Transferable Visual Models From Natural Language Supervision详解

    paper:https://arxiv.org/abs/2103.00020 代码:GitHub - openai/CLIP: Contrastive Language-Image Pretraini ...

  9. 【论文笔记】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

    一.概要   该文章发于ACL 2017,在Knowledge base-based question answering (KB-QA)上,作者针对于前人工作中存在没有充分考虑候选答案的相关信息来训 ...

  10. 【论文笔记1】von Mises-Fisher Mixture Model-based Deep learning: Application to Face Verification

    [论文笔记1]von Mises-Fisher Mixture Model-based Deep learning: Application to Face Verification 1 介绍 人脸识 ...

最新文章

  1. Forcepoint DLP解决方案持续推高各机构的业务发展进程
  2. ajax(Tibco) 与 SQL server 2005(5)
  3. UPS对发电机组的影响
  4. 终于解决了无运行无网上邻居的问题
  5. 【bzoj2654】tree(二分+MST)
  6. html可编辑下拉选项卡,bootstrap可编辑下拉框jquery.editable-select
  7. 电商数据分析Excel案例
  8. 95后妈妈8成是全职,爸爸去哪了?
  9. 中科大EPC课程爬取
  10. 【数学基础】一份非常适合人工智能学习的线性代数基础材料中文版 (国内教材精华)...
  11. 字体管家射手座 - 绿斗堂字体网
  12. mysql数据血缘分析,数仓字段血缘解析实现—hive版
  13. 企业/工作室官网 期末作业
  14. graylog+kafka+zookeeper(单机测试及源码),graylog收集kafka(脚本创建发布订阅方式)存储的消息(四)
  15. 潮阳实验学校文件服务器,【潮实】潮阳实验学校校歌(调教用)
  16. Git首次提交代码到远程仓库时,出现fatal: unable to access ‘https://github.com/xxx/xxx.git/‘
  17. java根据前序和中序建树_Java实现根据前序遍历构建二叉树(前序遍历、中序遍历、后序遍历)...
  18. 虚拟机装系统后无法打开系统解决方案
  19. 计算机网络 与信息安全专业就业,信息安全专业是学什么的 毕业后的就业方向有哪些...
  20. CS5266替代AG9311设计TYPEC转HDMI带PD3.0音视频拓展坞方案

热门文章

  1. linux安装 java jdk
  2. OpenCV 简单的人脸识别
  3. mysql使用数据库预处理_php中对MYSQL操作之预处理技术(2)数据库dql查询语句
  4. reverseString
  5. 讨论:如何降低Cocos2d开发的游戏包体大小
  6. PHP获取MySQL执行sql语句的查询时间
  7. 下面代码打印的结果?
  8. OpenCV + python 实现人脸检测(基于照片和视频进行检测)
  9. 十分简洁的手机浏览器 lydiabox
  10. org/springframework/core/MethodClassKey