Sarcasm Detection with Self-matching Networks and Low-rank Bilinear Pooling
Sarcasm Detection with Self-matching Networks and Low-rank Bilinear Pooling
click here:文章下载
方法综述:
本文中使用了三个模型,分别是self-matching network、Bi-LSTM、Low-rank Bilinear Pooling method(LBPR):
self-matching network: 通过单词对间的信息,获取句子的incongruity information
Bi-LSTM: 通过句子的序列信息,获取句子的compositional information
Low-rank Bilinear Pooling method: 融合incongruity information和compositional information
各模型算法:
self-matching network
target: 求输入句子的 attend feature vector : fa∈Rk⟹fa=S⋅af_a \in R^k \implies f_a=S·afa∈Rk⟹fa=S⋅a
S是输入句子的word-embedding表示,S∈Rk×nS \in R^{k \times n}S∈Rk×n
于是问题转变成为,求解self-matched attention vector : a∈Rna \in R^na∈Rn
其中,k为单词表示维度,n为句子单词数。
求解a∈Rna \in R^na∈Rn:
考虑到,单词对表示向量间进行内积运算,只抓住特征向量间的相关性,却忽视了情感信息,所以定义了一种新的计算方式。对于单词对(ei,ej)(e_i, e_j)(ei,ej),ei∈Rke_i \in R^kei∈Rk:
joint feature vector: wi,j∈R⟹wi,j=tanh(ei⋅Mi,j⋅ejT)w_{i,j} \in R \implies w_{i,j}=tanh(e_i · M_{i,j} · e_j^T)wi,j∈R⟹wi,j=tanh(ei⋅Mi,j⋅ejT)
其中,Mi,j∈Rk×kM_{i,j} \in R^{k \times k}Mi,j∈Rk×k,是要学习的参数。
建立self-matching information matrix : W∈Rn×nW \in R^{n \times n}W∈Rn×n:
对WWW每行取最大值,组成向量 m∈Rnm \in R^nm∈Rn
⟹a=Softmax(m)⟹a∈Rn\implies a=Softmax(m) \implies a \in R^n⟹a=Softmax(m)⟹a∈Rn
Bi-LSTM
target: 利用Bi-LSTM的隐含层输出,作为输入句子的特征向量feature vector : fl∈Rd⟹fl=h1f_l \in R^d \implies f_l=h_1fl∈Rd⟹fl=h1,d是超参数,hi∈Rdh_i \in R^dhi∈Rd。
注:此处有个疑问,为什么只使用第一个时间步的输出呢?最后一个时间步的输出又如何呢?
Low-rank Bilinear Pooling
target: 融合上述两个模型得到的向量fa∈Rk,fl∈Rdf_a \in R^k, f_l \in R^dfa∈Rk,fl∈Rd,得到最终的融合向量f∈Rcf \in R^cf∈Rc,并进行二分类,得到输出向量pi∈R2p_i \in R^2pi∈R2。c是超参数。
f=UT⋅fa∘VT⋅fl+bf=U^T \cdot f_a \circ V^T \cdot f_l + bf=UT⋅fa∘VT⋅fl+b
pi=Softmax(Wf⋅f+b)p_i=Softmax(W_f \cdot f + b)pi=Softmax(Wf⋅f+b)
其中,U∈Rk×c,V∈Rd×c,g∈Rc,Wf∈R2×c,b∈R2U \in R^{k \times c}, V \in R^{d \times c}, g \in R^{c}, W_f \in R_{2 \times c}, b \in R^2U∈Rk×c,V∈Rd×c,g∈Rc,Wf∈R2×c,b∈R2,这些都是需要学习的参数。
注:∘\circ∘ 表示 Hadamard Product,简单来说就是矩阵对应位置元素相乘。
训练目标:
待学习参数:θ={Mi,j,U,V,g,Wf,b}\theta = \{ M_{i,j},U,V,g,W_f,b \}θ={Mi,j,U,V,g,Wf,b}
超参数:d,c,λd, c, \lambdad,c,λ
Sarcasm Detection with Self-matching Networks and Low-rank Bilinear Pooling相关推荐
- 【卷积神经网络的加速】Speeding up Convolutional Neural Networks with Low Rank Expansions
主题:[深度卷积神经网络的加速] Speeding up Convolutional Neural Networks with Low Rank Expansions 附上论文链接:上一篇中提到的低秩 ...
- 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》
深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...
- 读书笔记:Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks
Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks 著名的faster R-CNN 当然应该好好 ...
- 谣言检测相关论文阅读笔记:Towards Multi-Modal Sarcasm Detection via Hierarchical Congruity Modeling
Towards Multi-Modal Sarcasm Detection via Hierarchical Congruity Modeling with Knowledge Enhancement ...
- 【论文阅读】Multi-Modal Sarcasm Detection 图文反讽识别
Multi-Modal Sarcasm Detection 图文反讽识别 题目:Multi-Modal Sarcasm Detection in Twitter with Hierarchical F ...
- 【论文泛读】Modeling Intra and Inter-modality Incongruity for Multi-Modal Sarcasm Detection
论文题目:Modeling Intra and Inter-modality Incongruity for Multi-Modal Sarcasm Detection 时间:2020 来源:EMNL ...
- Scalable Object Detection using Deep Neural Networks 阅读笔记
Scalable Object Detection using Deep Neural Networks 基于深度神经网络的可伸缩目标检测 14年的文章 是一个用于检测的显著性启发式神经网络模型, 分 ...
- 论文 | Credit Card Fraud Detection Using Convolutional Neural Networks
本篇博客继续为大家介绍一篇论文,也是关于用卷积神经网络 CNN 来进行信用卡欺诈检测的. 论文信息 论文题目:Credit card fraud detection using convolution ...
- [Paper]Cardiologist-Level Arrhythmia Detection with Convolutional Neural Networks
Cardiologist-Level Arrhythmia Detection with Convolutional Neural Networks 基于卷积神经网络的心脏科医生级别的心律失常检测 A ...
最新文章
- ajax动态获取url参数值,获取URL参数的方法
- 2018年,自然语言处理很全的应用与合作
- 区块链 POW功能结构讲解 通用极小代码结构 区块链所必须的组件模块
- Java中的锁 | JDK6 关于锁的优化
- 两个好用的eclipse js编辑器插件
- python根据经纬度计算两点之间距离
- 小甲鱼C++快速入门学习笔记
- 泛泛而谈的菜鸟学习记录(六)—— 贴花
- 9. PHP接入微信支付订单、退款订单、转款订单的查询
- 一位浙大教授令人寒心的演讲,说出了真话!
- ​联想小新潮7000-13更换ssd并重装系统记录
- RFID射频卡、IC卡、ID卡在称重系统中有什么作用
- nacos1.1.4连接mysql 8.0.18步骤(有图有真相)
- [校园广播系统 | IP广播 | 数字广播]校园数字IP网络广播系统方案
- flv 协议解析 (学习记录)
- MicroStrategy 9 - Extending Business Intelligence
- 推荐几个免费的国外图像库,数字图像处理必备
- 基于Python的项目成本管理系统设计
- layer 弹出在 iframe内部弹出不居中是原因
- THREEJS-甜甜圈的掉落| 大帅老猿threejs特训