论文标题:A Deep Learning Model for Early Detection of Fake News on Social Media
日期:IEEE2020

#半监督、#伪标签、#可信度评估

一、基本内容

训练一个有监督模型和一个无监督模型,但是该工作不仅利用了新闻内容信息,还利用了用户对新闻的评论信息以及作者的可信度信息,使用的信息更为广泛,从而取得了更好的效果。

二、主要工作

(1)建立一个模型提取用户在评论中表达的观点;
(2)使用CredRank算法评估用户的可信度;
(3)建立一个参与新闻传播的用户的小网络。
以上三个步骤的输出作为新闻分类器SSLNews的输入,SSLNews由三个网络组成:共享的CNN、无监督的CNN和有监督的CNN。

三、模型框架

四个模块:意见提取模块、用户可信度评估模块、用户网络构建模块和分类器

提取 回复 和 用户特征,回复 用作 意见提取块的输入,用户特征 用作 可信度评估和网络构建块的输入。将意见提取块的输出和可信度评估块的输出连接起来,连接结果和网络N用作分类器SSLMEWS的输入。

1. Opinion extraction

使用GloVe作为网络的嵌入层,使用tanh作为激活函数。

这一网络的输出评论中表示的意见:1——作者同意给定的推文,0——不同意。

使用Sentiment140训练模型。

2. User’s credibility assessment
使用论文【M. A. Abbasi and H. Liu, “Measuring user credibility in social media,” International Conference on Social Computing, Behavioral-Cultural Modeling, and Prediction, pp. 441-448, 2013】中的(即CredRand算法)模型评估用户可信度。

研究基于用户的特征:
(1)用户账户是否是经过验证的账户;
(2)用户发布的状态数量;
(3)用户的地理定位是否启用;
(4)用户的粉丝数;
(5)用户关注的用户数量。

找到具有相似特征的用户,使用分层聚类方法将相似的用户聚合,用sim(ui,uj)=σ(C(ui),C(uj))sim(u_i,u_j )=σ(C(u_i ),C(u_j))sim(ui​,uj​)=σ(C(ui​),C(uj​))确定相似性(C(ui)C(u_i )C(ui​)表示用户特征)。

在我们的模型中,使用Jaccard相似度评估用户之间的相似度:sim(ui,uj)=(C(ui)∩C(uj))/(C(ui)∪C(uj))sim(u_i,u_j )=(C(u_i)∩C(u_j))/(C(u_i)∪C(u_j))sim(ui​,uj​)=(C(ui​)∩C(uj​))/(C(ui​)∪C(uj​))。如果相似度超过阈值tautautau(tautautau的值因域而异),则使用上述方法将相似用户聚集在一起。

使用以下公式分配集群的权重:ωCi=∣Ci∣∑j∣Cj∣ωC_i ={{\sqrt{|C_i |}}\over{∑_j \sqrt{|C_j |}}}ωCi​=∑j​∣Cj​∣​∣Ci​∣​​,该值表示可信度与成员相关联。

3. User’s network
只考虑发布相关新闻文章n推文的用户的粉丝。网络构建的算法:

UpU_pUp​表示发表有关新闻n推文的用户的向量,UrU_rUr​表示回复推文的用户的向量。算法复杂度为O(x2)O(x^2)O(x2)。

4. SSLNews

xix_ixi​是输入,是之前三个网络(1、2、3)输出结果的连接。标签yiy_iyi​仅存在于标记的输入中,仅仅对于这些输入计算交叉熵损失lil_ili​。xix_ixi​的预测标签是yi′y_i^{'}yi′​。lil_ili​和li′l_i^{'}li′​的优化权重为w(t)w(t)w(t)。

共享CNN的前三个卷积层包含128(3×3)个滤波器,其他三个层包含256(3×3)个滤波器。无监督和有监督CNN的层都使用512(3×3)个滤波器、256(3×3)个滤波器和128(3×3)个滤波器。一个(2×2)最大池化用于所有池化层。
Loss=−1∣B∣∑i∈B∩Slogfsoftmax(zi)[yi]+w(t)∗1C∣B∣∑i∈B∣∣zi−zi′∣∣2Loss=-{1\over |B|} ∑_{i∈B∩S}{logf_{softmax}(z_i )[y_i ] }+{w(t)}*{1\over C|B| }∑_{i∈B} {||z_i-z_i^{'} ||}_2Loss=−∣B∣1​∑i∈B∩S​logfsoftmax​(zi​)[yi​]+w(t)∗C∣B∣1​∑i∈B​∣∣zi​−zi′​∣∣2​
B表示学习过程中的微批量处理,S表示标记的输入集。

四、数据集

现实公开数据集:Politifact和Gossipcop

虚假新闻检测论文阅读(六):A Deep Learning Model for Early Detection of Fake News on Social Media相关推荐

  1. 虚假新闻检测论文阅读(七):A temporal ensembling based semi-supervised ConvNet for the detection of fake news

    论文标题:A temporal ensembling based semi-supervised ConvNet for the detection of fake news articles 日期: ...

  2. 虚假新闻检测论文调研

    虚假新闻检测论文调研 Evidence Inference Networks for Interpretable Claim Verification 基本信息 发表刊物和年份:2021 AAAI 摘 ...

  3. 论文阅读笔记——A deep tree-based model for software defect prediction

    本论文相关内容 论文下载地址--Web Of Science 论文中文翻译--A deep tree-based model for software defect prediction 论文阅读笔记 ...

  4. 【目标检测论文阅读笔记】Feature-Enhanced CenterNet for Small Object Detection in Remote Sensing Images

    Abstract: 与 anchor-based基于锚点的检测器相比,anchor-free无锚点检测器 具有灵活性和较低计算复杂度的优点.然而,在复杂的遥感场景中,受限的几何尺寸.目标的弱特征 以及 ...

  5. 三维目标检测论文阅读:VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection

    VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection 理解了PointPillars这篇文章后,看这篇文章就清 ...

  6. 目标检测论文阅读:Multi-scale Location-aware Kernel Representation for Object Detection(CVPR2018)

    Multi-scale Location-aware Kernel Representation for Object Detection 论文链接:https://arxiv.org/abs/180 ...

  7. 异常检测论文阅读《PANDA: Adapting Pretrained Features for Anomaly Detection and Segmentation》

    <PANDA: Adapting Pretrained Features for Anomaly Detection and Segmentation> CVPR2021 论文背景: 近年 ...

  8. 【论文阅读】TranAD: Deep Transformer Networks for Anomaly Detection inMultivariate Time Series Data

    TranAD架构 模型构建:  = {

  9. 【DeepSketch2Face论文阅读】A Deep Learning Based Sketching System for 3D Face and Caricature Modeling

    这篇文章是香港大学韩晓光老师等人在SIGGRAPH 2017的工作,创建了一个业余者也可以创建3D Face或漫画模型的系统. CV上目前存在许多场景,包含卡通角色,社交媒体上的虚拟形象,3D Fac ...

最新文章

  1. 007 Android之Broadcast Receiver
  2. 用xml配置文件加载资源时(XML和XMLList的转换)
  3. php无限分类原理,php 递归无限级分类原理和实现代码
  4. linux 中w和x 区别,r、w、x权限在文件和目录中的含义有何区别?
  5. put多文件上传linux,linux 上传lftp 服务器
  6. 调优 | 别再说你不会 JVM 性能监控和调优了
  7. 国潮国粹剪纸风京剧人物PSD素材,让东方韵味更浓
  8. python 列表,数组,矩阵两两转换tolist()
  9. 关于Java观察者模式的一点思考
  10. Spring底层原理问题
  11. 一个屌丝程序猿的人生(八十六)
  12. 3. 站在使用层面,Bean Validation这些标准接口你需要烂熟于胸
  13. 深度估计(Depth Estimation)
  14. 采集日志实践-ELK以及filebeat配置解析
  15. MySQL提示:The server quit without updating PID file问题的解决办法
  16. OpenCV~图像处理API(逆光、模糊、亮度、雾霾)
  17. Unity3D手机游戏原创分享(益智类)
  18. 云服务器怎么搬砖,逆水寒,预约五个新区 , 新区如何搬砖,来看看你该如何搞...
  19. 计算机组成原理指令寻址方式,计算机组成原理第四章第4讲指令和数据的寻址方式.ppt...
  20. html 页面模糊效果,前端 - 页面滤镜成效及高斯模糊效果

热门文章

  1. ios非常全的库iOS开发 非常全的三方库、插件、大牛博客等等
  2. 【拼车小程序源码分享】前后端源码方便省力快速搭建首选拼车CMS系统
  3. 深入理解采样定理 + Matlab 仿真 Sa 函数的采样与恢复
  4. 微服务springcloud+Vue的在线汽车用品销售商城平台
  5. Wish店铺选品方向|实战
  6. ISO 26262功能安全标准体系解读(上)
  7. 【Excel】178个常用快捷键
  8. 无人机360°VR全景图制作方法
  9. Vue生命周期及组件
  10. 补充总结html所有内容,html学习完这篇基本就差不多了