目录

目标:

数据:

结构:

数据和代码:

社区发现:


目标:

理解并掌握方法

数据:

外网数据源,github上可下载已处理过的数据

结构:

lDidegah(2018年)数据集,包含各种属性,包括替代指标和推文标识、作者姓名、作者标识、关注者数量以及指示用户是机器人还是人类的相关标签。这个数据集包含总共4540个带注释的用户,其中269个是已识别的机器人,包括混合用户。由于带注释的数据集不包含ATSN的推文网络相关的信息,将4540个用户的数据映射到哈桑等人(2017年)使用的altmetrics数据集(dataset-jun-4-2016.tar.gz版本)。该数据集包含2011年7月至2015年12月的870万条推文记录,其特征包括:推文ID;替代指标标识;作者-电影名称;作者-屏幕-姓名-提及;转发;和提及。

最终数据集由457,714个节点组成(每个节点代表一条推文),在由16,264个唯一用户(节点)组成的转发-提及网络中形成31,380条边(转发或提及关系),其中64个是机器人

数据和代码

(python) 链接:https://pan.baidu.com/s/1QHk8QNjGfNMrB5XRl2FKYQ
提取码:hdpa

社区发现

社区检测是研究复杂社会网络的一个关键特性。社区结构没有通用的定义,但人们普遍认为,它代表一个节点子组,在该社区内连接的概率很高,而连接到网络其余部分的概率很低。根据这个定义,一个社区代表一群有相似兴趣的人。这篇文章使用的是Said et al. (2018)提出的社区检测算法.使用社区发现算法的目的是找到影响力高的节点。

TriangleCount算法“统计每个顶点所在的三角形个数(反映节点连通性,三角形越多,连通性越强)

聚类系数cc:

L:vi的相邻节点数,K:集合可能的边数|Ni|*(|Ni|-1)/2

贴近中心度:

贴近度中心度计算一个节点相对于网络中所有其他节点的最短路径的贴近度

d(u,v)表示u和v之间的最短路径

社区大小和节点度分布

左边:X轴是社区大小,y轴是社区数量,社区规模遵循幂律分布;右侧示出了一百个随机节点的度分布,其也遵循幂律分布。

(左)每个机器人所在三角形的中心度和数量;(右)各机器人的聚类系数和贴近度中心度


Mohammadrezaei M R, Shiri M E, Rahmani A M. Detection of fake accounts in social networks based on One Class Classification[J]. The ISC International Journal of Information Security, 2019, 11(2): 173-183.

利用图神经网络进行社交机器人检测相关推荐

  1. 微软熊辰炎:如何利用图神经网络解决半结构化数据问题?

    对于许多信息检索和知识图谱研究者来说,究竟应该使用抽象的结构化信息进行表示学习还是使用海量的文本信息始终是一个富有争议的话题.在本届智源大会上,来自微软研究院的高级研究员熊辰炎博士带来了题为" ...

  2. [EGNN] Exploiting Edge Features for Graph Neural Networks 利用图神经网络的边特征 论文详解 CVPR 2019

    文章目录 1 简介 1.1 GAT和GCN的局限性 1.2 EGNN的创新点 2 相关工作 3 EGNN网络 3.1 符号定义 3.2 EGNN和GNN的对比 3.3 Doubly stochasti ...

  3. 基于图神经网络的代码漏洞检测方法

    文章结构 1. 引言 1.1 漏洞现状 1.2 漏洞研究传统特点 现有的研究方案大多把源代码转化为文本序列,使用自然语言处理中常用的循环神经网络进行自动化特征提取,但这忽略了代码中由于跳转.循环.判断 ...

  4. 社交机器人检测:Detect Me If You Can: Spam Bot Detection Using InductiveRepresentation Learning--论文阅读

    论文链接:Detect Me If You Can: Spam Bot Detection Using Inductive Representation Learning | Companion Pr ...

  5. [论文阅读] (27) AAAI20 Order Matters: 基于图神经网络的二进制代码相似性检测(腾讯科恩实验室)

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  6. 【论文整理】基于图神经网络的社交推荐模型整理Graph Neural Networks for Recommender Systems: Challenges, Methods, and Direct

    社交推荐模型发展历程 图形构造 在具有社会意识的推荐系统中,用户的最终行为取决于朋友的社会影响和他/她自己的偏好.社交推荐面临的主要挑战之一是如何构建社交图来捕捉朋友的社交影响.一般来说,社交网络中的 ...

  7. Paper:《Graph Neural Networks: A Review of Methods and Applications—图神经网络:方法与应用综述》翻译与解读

    Paper:<Graph Neural Networks: A Review of Methods and Applications-图神经网络:方法与应用综述>翻译与解读 目录 < ...

  8. 百度图神经网络7日打卡营--DAY01前半部分 总结

    首先很感谢百度AI团队这个平台,给大家请来世界级冠军来给大家做这一次的7日打卡营活动, 还提供免费的GPU算力平台,以及成熟可用的 包含刷新目前 最权威的 图神经ORB榜单的SOTA模型的 PGL 图 ...

  9. 迁移学习与图神经网络“合力”模型:用DoT-GNN克服组重识别难题

    作者 | Ziling Huang.Zheng Wang.Wei Hu.Chia-Wen Lin.Shin'ichi Satoh 译者 | 刘畅 编辑 | Jane 出品 | AI科技大本营(ID:r ...

  10. 178页,四年图神经网络研究精华汇总

    Datawhale推荐 来源:机器之心 对于普通人来说,将自己的学位论文公布到社交媒体可能需要点勇气.但如果实力够硬,多少人检阅都是不怕的.最近,图卷积网络(GCN)的作者 Thomas Kipf 就 ...

最新文章

  1. JS判断页面加载完毕
  2. PMCAFF《产品经理第一课》第三期开始报名!天团导师再次升级,631培训模式升级...
  3. 《程序是怎样跑起来的》第一章
  4. 什么是实例对象python_python判断类型:想知道一个对象(实例或者变量)是什么类型,什么结构的...
  5. CF508D Tanya and Password(欧拉回路)
  6. 图谱实战 | 知识图谱构建的一站式平台gBuilder
  7. python args kw_Python基础-参数魔法,*args,**kwags
  8. 表格下拉_【职场充电】要说制作一个漂亮的表格,高手都爱WPS
  9. 移动端小总结(1)---meta、input和单行多行文字溢出省略号
  10. centos挂载第二块硬盘
  11. labview 一个tdms文件 两个线程同时往里写_LabVIEW 状态图(Statechart)介绍
  12. 战略分析思路——沙盘推演逻辑
  13. opencv分别显示彩色图片各通道图片
  14. java中隐函数求导法则_隐函数求导的三种方法
  15. 解决关于VS无法加载解决方案中的项目的问题
  16. 什么是时间复杂度与空间复杂度
  17. SSM实现邮箱验证功能
  18. JPEG算法解密 JPEG原理详解 (转载 by jinchao)
  19. FPGA串口接收与发送详解( part 3 )
  20. 汇编指令 int 21 h 调用

热门文章

  1. android手机的屏幕录制在哪里,手机屏幕录制在哪里,安卓手机视频录制软件分享...
  2. php mysql 嵌套查询_MySQL的嵌套查询_MySQL
  3. mysql 支持嵌套查询吗_【转】MySql 嵌套查询
  4. html日期框样式设置
  5. SqlServer——Excel连接数据库相关知识
  6. linux 交叉编译yuv,libyuv交叉编译
  7. html中字体 楷体_(收藏)css怎么设置字体为楷体?
  8. Java之美[从蛮荒到撬动地球]之设计模式三
  9. MagicDraw二次开发过程
  10. 美洽在线客服系统使用指南