本文提出了一种新的综合性的模型结构:CASCADE(ContextuAl SarCAsm DEtector),它充分利用了每条文本的上下文信息,包括:

  • 文本的用户信息(用户文体风格信息+用户个性信息);
  • 文本的主题信息。

CASCADE模型的大致流程如下:

  1. 构建用户嵌入:首先利用每个用户的历史文本得到用户的写作风格嵌入和用户个性嵌入,并利用典型相关分析(CCA)将两个向量融合到一起得到用户嵌入;
  2. 构建主题嵌入:首先根据主题将文本进行分割,然后利用Paragraph Vector得到每个主题的嵌入;
  3. 构建文本嵌入:用textCNN得到文本嵌入;
  4. 将文本嵌入、用户嵌入和主题嵌入拼接起来,作为一个文本的整体综合嵌入。

1. 模型结构详解

1.1 构建用户嵌入

用户(user)是指发布该post的用户,用户信息主要分为用户的文体风格(Stylometric,该特征常用来分析文章的作者,即Authorship Analysis,)和用户的个性化(Personality,可使用Personality分析人的行为)。

  • 建模用户文体风格流程:

    注意,每条post后要加一个特殊标志。

  • 建模用户个性流程:

    Specifically, the CNN is pre-trained on a benchmark corpus developed by Matthews and Gilliland (1999) which contains 2, 400 essays and is labeled with the Big-Five personality traits, i.e., Openness, Conscientiousness, Extraversion, Agreeableness, and Neuroticism (OCEAN)。用这个预训练的CNN来提取用户个性化信息,其中词向量使用的是预训练的FastText训练出来的词向量。

  • 最后将文体风格矩阵和用户个性化矩阵,使用典型相关性矩阵(CCA)融合降维为User Embeddings。
    For each user ui, the objective of CCA is to find the linear projections of both embedding vectors that have a maximum correlation. 如下:
    ui⃗=(di⃗)TA1+(pi⃗)TA2\vec{u_i} = (\vec{d_i})^TA_1+(\vec{p_i})^TA_2 ui

    =(di

    )TA1+
    (pi

    )TA2

    CCA:它可以捕捉到不同视图(D和P)之间的最大信息从而生成一个联合表示(U)。
    简单相关系数描述两组变量的相关关系的缺点:只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数,使问题显得复杂,难以从整体描述。典型相关是简单相关、多重相关的推广。典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。
    典型相关分析的实质就是在两组随机变量中选取若干个有代表性的综合指标(变量的线性组合), 用这些指标的相关关系来表示原来的两组变量的相关关系。
    CCA详解

1.2 构建主题嵌入

1.3 预测

2. 实验结果

使用的数据集是SARC(Reddit)



从实验结果可以看出:

  • 用户个性嵌入很重要;
  • CCA的融合方法比简单的concatenate有效很多;
  • 从可视化的图中,可以看出用户嵌入很有判别力,是CASCADE效果提升的关键。

CASCADE: Contextual Sarcasm Detection in Online Discussion Forums(2018)论文笔记相关推荐

  1. AAAI 2021 《Regularizing Attention Networks for Anomaly Detection in Visual Question Answering》论文笔记

    目录 简介 动机 方法 实验 简介 本文是POSTECH和Kakao合作的一篇文章. 论文链接 动机 异常检测有助于提升模型的稳定性和可靠性,也就是鲁棒性,OOD问题也可以视为一种异常.但是,单模态的 ...

  2. Faster R-CNN 《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》论文笔记

    本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.

  3. Reasoning with Sarcasm by Reading In-between(MIARN 2018)论文笔记

    本文主要是提出了一种新的模型:MIARN(Multi-dimensional Intra- Attention Recurrent Networks),Intra-attention其实可以看做是se ...

  4. 《UC-Net:Uncertainty Inspired RGB-D Saliency Detection via Conditional Variational Autoencoders》论文笔记

    参考代码:UC-Net 1. 概述 导读:这篇文章研究的是RGB-D数据的显著性目标检测问题,其中的D代表的是深度图,可以通过如Kinect之类的深度传感器/深度估计网络等得到.在之前RGB-D显著性 ...

  5. 谣言检测相关论文阅读笔记:Towards Multi-Modal Sarcasm Detection via Hierarchical Congruity Modeling

    Towards Multi-Modal Sarcasm Detection via Hierarchical Congruity Modeling with Knowledge Enhancement ...

  6. 【论文阅读】Multi-Modal Sarcasm Detection 图文反讽识别

    Multi-Modal Sarcasm Detection 图文反讽识别 题目:Multi-Modal Sarcasm Detection in Twitter with Hierarchical F ...

  7. 【论文泛读】Modeling Intra and Inter-modality Incongruity for Multi-Modal Sarcasm Detection

    论文题目:Modeling Intra and Inter-modality Incongruity for Multi-Modal Sarcasm Detection 时间:2020 来源:EMNL ...

  8. Sarcasm Detection with Self-matching Networks and Low-rank Bilinear Pooling

    Sarcasm Detection with Self-matching Networks and Low-rank Bilinear Pooling click here:文章下载 方法综述: 本文 ...

  9. 论文笔记 Object-Aware Instance Labeling for Weakly Supervised Object Detection - ICCV 2019

    Object-Aware Instance Labeling for Weakly Supervised Object Detection Kosugi ICCV, 2019 (PDF) (Citat ...

最新文章

  1. iframe vue 前进 后退_前端面试准备笔记系列之vue(01)
  2. BAdI:ME_PROCESS_REQ_CUST弹出消息问题
  3. Python报错:The truth value of an array with more than one element is ambiguous
  4. 小腿训练三部曲(一)
  5. mysql explain 派生表_MySQL的Explain命令
  6. Java的Stack类
  7. 马克龙宣布15亿欧元投资AI,DeepMind拥吻巴黎
  8. 解决新电脑的系统安装问题:针对BIOS的UEFI模式
  9. EAST: An Efficient and Accurate Scene Text Detector
  10. 控制网页frame vba_V8 bindings 设计isolate,context,world,frame之间的关系(翻译)
  11. Cesium 1.51新功能评测
  12. 银行的起源---》阮一峰,
  13. qimage加载jpg失败_QImage基本api
  14. 计算机信息单位中1GB等于,1gb等于多少mb 1gb换算多少mb
  15. 前端Vue+后端Django实现微信登录
  16. html仿qq截图,截图工具(仿QQ截图,大致功能都已实现)
  17. matlab从无到有系列(六):高级图形处理功能(多窗口绘图以及花瓶绘制)
  18. 关于企业数字化转型的建议
  19. 解决最新小马激活工具导致主页劫持问题
  20. windows7 安装pytorch简易教程

热门文章

  1. C 语言跳动的心(可变色版本)
  2. Suzy心情很差因为被charge了late fee Day42 | 动态规划之背包问题,416. 分割等和子集
  3. 如何让自己开发的web项目实现外网访问
  4. python中line表示什么_Python里matplotlib的颜色及线条等控制(linestyle/marker/color,全)...
  5. [转载]摩托车 各车型 坐姿 疲劳逻辑详解
  6. 匈牙利命名法(指导)
  7. mysql 关联更新_MySQL UPDATE多表关联更新
  8. STM32H743必要外围电路分析
  9. java GUL编程
  10. 《VTL语法参考指南》中文版[转]