原文链接:http://tecdat.cn/?p=7295

原文出处:拓端数据部落公众号

在这篇文章中,我用R语言和python检测社交网络中的社区

建立网络

Kaggle数据 在110个.egonet文件中(对应于110个匿名Facebook用户),每个文件都包含他的朋友的网络。

让我们关注文件0.egonet,其中包含有关用户0的网络的所有信息。文件的每一行都是该行中直接属于网络一部分的第一个用户的朋友的列表。

1

2

3

4

1: 146 189 229 201 204 ...

2: 146 191 229 201 204 ...

3: 185 80 61 188 22 222 ...

4: 72 61 187 163 177 138 ...

在下面,我附加了访问每个egonet文件的Python代码,并构建了Networkx构造函数的节点和边的列表。 构建图后,将计算其邻接矩阵并将其保存在csv文件中。

import networkx as nxfrom os import listdirfrom os.path import isfile, joinfrom sklearn.cluster import KMeansdef load_egonet_files(path):"""给定.egonet文件的路径,则返回包含所有文件的列表。"""onlyfiles = [fyle for fyle in listdir(path) if fyle.endswith('.egonet')]return onlyfiles#########################################################################################################

提供的代码的结果是110个CSV文件,其中包含每个自我网络图的邻接矩阵。

检测社区

首先,让我们绘制一个图,看看它在社区聚类检测之前的样子。在R代码下方,从CSV文件加载数据,构建网络(我们使用0.egonet)并进行绘制。

 #从csv文件读取图形dat = read.csv('graph-0.csv', header=TRUE, row.names=1, check.names=FALSE)m = as.matrix(dat)# 从邻接矩阵构建图g = graph.adjacency(m,mode="undirected",weighted=NULL)# 绘制图形

R 提供了几种强大的社区检测算法。

模块化本质上是属于给定组的边缘的分数减去如果边缘随机分布的期望分数。所以越高越好。

在这里,您可以在用户0网络上找到结果。


> modularity(wc)[1] 0.4629543> modularity(wc)[1] 0.4463902> modularity(wc)[1] 0.4330911> modularity(wc)[1] 0.4649535> modularity(wc)[1] 0.4511259> modularity(wc)[1] 0.4314803

spinglass.community算法是最好的算法,其模块化为0.4649。事实证明,可以发现小型自我社会网络中的社区 。

在下面,您也可以在R中发现检测到的群集的良好可视化效果。


最受欢迎的见解

1.采用spss-modeler的web复杂网络对所有腧穴进行分析

2.用R语言和python进行社交网络中的社区检测

3.R语言文本挖掘NASA数据网络分析,tf-idf和主题建模

4.在R语言中使用航空公司复杂网络对疫情进行建模

5.python隶属关系图模型 基于模型的网络中密集重叠社区检测

6.使用Python和SAS Viya分析社交网络

7.关联网络分析:已迁离北京外来人口的数据画像

8.情感语义网络:游记数据感知旅游目的地形象

9.用关联规则数据挖掘探索药物配伍中的规律

拓端tecdat|用R语言和python进行社交网络中的社区检测相关推荐

  1. 数据挖掘r语言和python知乎_Hellobi Live |R语言爬虫实战案例分享:网易云课堂、知乎live、今日头条、B站视频...

    课程名称 R语言爬虫实战案例分享:网易云课堂.知乎live.今日头条.B站视频 网络数据抓取是数据科学中获取数据中的重要途径,但是一直以来受制于高门槛,都是专业程序员的专属技能.直到R语言和Pytho ...

  2. R语言和python语言的区别在什么地方,各自的应用场景是什么

    R语言和Python语言都是广泛使用的数据分析和科学计算语言,但它们有一些不同之处. R语言是一种专门用于数据分析和统计建模的编程语言.它提供了许多内置的数据结构和函数,可以方便地进行数据处理.可视化 ...

  3. R语言和Python连接hive

    连接原理:R语言和Python连接,R中读取的数据可以传递到python中进行处理,同理python中的结果可以传递到R语言中进行,二者满足双向传递.而Python连接hive的方法较多且简单,因此采 ...

  4. 生物学经典blast比对算法,R语言和Python如何实现?

    Blast比对算法原理与实现方式 做生物的同学肯定听说过blast比对这个方法,一般在NCBI等网站上可以在线进行比对,也可以在本地服务器进行比对,那么blast算法究竟是怎么实现对不同序列的比对呢? ...

  5. r语言和python的区别_c语言和python的区别

    c语言和python的区别 1.语言类型不同. Python是一种动态类型语言,又是强类型语言.它们确定一个变量的类型是在您第一次给它赋值的时候.C 是静态类型语言,一种在编译期间就确定数据类型的语言 ...

  6. r语言和python爬虫谁厉害_R语言中,RCurl优势在哪儿,做爬虫的话用Python还是RCurl效率高?...

    由于电商网站的数据的实时性要求,数据分析时一般直接从网页爬取.因此使用爬虫的方法显得十分重要.R作为数据分析的软件,可以直接对爬取的数据进行后续处理,加上上手快的特点,是电商网站数据爬取和分析的好工具 ...

  7. R语言和 Python —— 一个错误的分裂

    全世界有3.14 % 的人已经关注了 数据与算法之美 最近有一些文章提出与年龄相关的问题:"崭露头角的年轻数据科学家们是学习R语言还是Python更好?" 答案似乎都是" ...

  8. r语言和python的区别-Python和R语言之分析对比

    在Python中调用R或在R中调用Python,为什么是"和"而不是"或"? 在互联网中,关于"R和Python"的文章,排名前十的搜索结果 ...

  9. r语言和python的区别_机器学习怎样开始比较好?Python还是R语言?

    全文共3077字,预计学习时长11分钟 图源:unsplash 机器学习是近几年来最热门的技术之一,也许你对机器学习很感兴趣,但却不知从何处下手.别担心,兴趣是最好的老师这里有你开启该领域职业生涯的完 ...

  10. r语言和python爬虫谁厉害_R vs Python: 谁是最好的数据科学语言?

    作者:Lou Bajuk 翻译:黄小伟,资深数据从业者.目前就职杭州有赞数据分析团队,欢迎加入! 简历邮箱:huangxiaowei@youzan.com 从我们成立之初,RStudio就致力于几个关 ...

最新文章

  1. 从浏览器发展史读懂user-agent
  2. java rgb 黑色_Java实现图片亮度自动调节(RGB格式)
  3. Python基本语法_强制数据类型转换
  4. 理解SQL Server中索引的概念,原理以及其他
  5. mac运行python速度慢_python-3.x – Pygame简单循环在Mac上运行得非常慢
  6. php mongo 游标超时,游标在MongoDb游标上超时错误
  7. [转]Web3 是去中心化的“骗局”?
  8. nssl1257-A【数论】
  9. Byteman –用于字节码操纵的瑞士军刀
  10. Java入门篇 2021/02/22
  11. 从BI到OLAP,数据仓库最终到底能干什么?
  12. 云小课 | IPv4枯了,IPv6来了
  13. Spring高级之注解@ComponentScan详解(超详细)
  14. mysql 修改表属主_mysql主从配置实现一主一从读写分离
  15. vue 引入qunee_(原创) 工作流程图的树形展示-使用qunee插件实现
  16. 重新定义QLabel的clicked事件
  17. 量化视角下的基金定投策略
  18. 如何制造一个XcodeGhost ?
  19. 如何将你的Linux服务器清空?
  20. 魔道祖师 (作者:墨香铜臭)mobi格式下载

热门文章

  1. 数据库服务器编码,数据库编码,数据库表编码,数据库表字段编码
  2. SharePoint Foundation 2013安装-1:先决条件准备
  3. :《我相信》腾讯QQ vs 360决战版
  4. C语言中extern 全局变量,二进制文件与内存,static,const对栈,内存的使用情况
  5. 网络相关、firewalld和netfilter、netfilter5表5链介绍、iptables语
  6. APP开发难吗?澳大利亚10岁儿童已开发5个手机App
  7. 品味FastDFS~目录
  8. Processing的条件式
  9. BZOJ 1677. [Usaco2005 Jan]Sumsets 求和
  10. Java描述设计模式(01):单例模式