这个数据集标注的用户有4467位,通过筛选,将网络范围缩小到标注用户以及与标注用户具有关注关系的用户,筛选后网络节点数量为445150个节点。首先观察网络的形态
工具:gephi

节点颜色:

节点大小由其HUB值决定。
可以看到并没有什么很明显的社团结构。而且从未标注节点的角度看,仅与相同loc相连接的未标注节点并不多。
如果是猜测角度出发,那么如果一个未标注节点的所有邻居都是一个Loc的,那么,这个未标注节点为同一种loc的可能性会比较大
所以,选择未标注节点,节点的邻居为一种loc,节点边数最少为3,即最少连接三个已标注用户。网络参数为:节点数为6451,边数为14735。

初步观察可以发现具有大量未标注用户与已标注用户交织连接。当然也存在一些已标注用户没有关注用户与之相连接,原因自然是这个网络数据量仍然不全面,或者关注用户是 异质的。
初步断定这种因素下的未标注用户是否与所连接的节点是一致的。


使用openord工具,支持10亿以上的点,速度非常快

Graph Distance Report
Results: Diameter: 33
Radius: 0
Average Path length: 7.644273763632479
Algorithm: Ulrik Brandes, A Faster Algorithm for Betweenness Centrality, in Journal of Mathematical Sociology 25(2):163-177, (2001)

由图中也可以看出,标注用户以华东与华北为主。由图距离报告可以看出,是否符合“六度分隔”理论呢?
一些有趣的点

本来的想法呢是通过未标注数据来判断:是否与相同loc连接的节点loc也能够确定,但是没有这方面的数据。所以弃了。
如果想要在这个图上进一步的进行处理,可以使用边近似的方式 ,未标注点成为一条边,绕过未标注数据。

整个实现思路比较简单,代码就不上传了。欢迎有想法的小伙伴与我讨论,QQ22549524

SMP_WEIBO_2016 微博用户画像 可视化(未完成)相关推荐

  1. 手把手教你:基于Django的用户画像可视化系统

    系列文章 第九章.手把手教你:个人信贷违约预测模型 第八章.手把手教你:基于LSTM的股票预测系统 第七章.手把手教你:基于深度残差网络(ResNet)的水果分类识别系统 目录 系列文章 一.项目简介 ...

  2. 微博 用户画像_分析用户画像?从微博数据采集开始!

    想设计一款新的产品,你了解未来的用户是什么样吗?想提升服务质量,用户调研应该怎么做?想评估新功能上线效果,用户情感偏好你了解吗?有了用户画像,这些问题的答案就变得逐渐清晰起来. 那么关键问题来了,用户 ...

  3. 微博 用户画像_微博/抖音/快手/小红书/B站内容营销和粉丝画像研究

    用户画像数据在市面上最难获得的一批数据,因为就算大部分咨询公司会对外公开趋势数据和大的宏观数据,一般不会公开用户画像数据,因为这部分的含金量最大,可以用于广告的投放,新媒体的预算分配,个人创业者平台的 ...

  4. 微博 用户画像_“肖战”被抵制?Python爬虫揭秘肖战粉丝的人群画像

    前一阵子,由于肖战的"227事件"微博和朋友圈都被刷屏,起因在与肖战的粉丝发现在AO3作品库平台收录关于肖战的同人作品,认为该部作品影响了肖战的形象,遂向有关部门举报,最终告知知名 ...

  5. 万字用户画像标签体系建设分析指南!

    转自:大数据梦想家 01 什么是用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特 ...

  6. 标签体系下的用户画像建设小指南

    点击上方蓝色字体,选择"设为星标 一. 什么是用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信 ...

  7. 数据中台:基于标签体系的360°用户画像

    作者丨石秀峰 全文共6375个字,建议阅读需18分钟 一.从"标签"说起 标签是用来标志您的产品目标和分类或内容,像是您给您的目标确定的关键字词,便于您自己和他人查找和定位自己目标 ...

  8. 从0-1构建用户画像数据分析流程

    与其因为泯然众人而惶恐不已,不如在众生中觅得自我.--数据说·实操季 导读:大数据经过近几年的迅速发展,从基础设施建设到应用层面,主要有数据平台搭建及运维管理.数据仓库开发.上层应用的统计分析.报表生 ...

  9. MySQL实战演练——如何才能构建逾期用户画像?【数据可视化】

    大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师.欢迎大家跟我一起走进数据分析的世界,一起学习! 感兴趣的朋友可以关注我或者我的数据分析专栏,里面有许多优质的文章跟大家分享哦. 目录 必 ...

  10. python 用户的画像可视化呈现技术_一人一车一面:解读汽车大数据用户画像背后的AI技术...

    背景介绍 大数据 大数据主要有五个特征,我们称为5V特征:Volume(大量).Variety(多样).Value(价值).Velocity(速度).Veracity(质量). Volume(大量): ...

最新文章

  1. 计算机科学与技术专业导论_教育部最新公布!西安工业大学新增4个本科专业!...
  2. 关于DateTime和String转换的容易犯得错误
  3. 是什么摧毁了程序员的工作效率
  4. 四元数c语言,C + OpenGL四元数
  5. Nginx 的 Location 配置指令块
  6. Golang实践录:调用C++函数
  7. 普通二本,去了小公司,我也想改变
  8. MFC 鼠标光标资源 及 更换
  9. Spring中@DependsOn注解的作用及实现原理解析
  10. 图像分割与GAN网络
  11. TODS:从时间序列数据中检测不同类型的异常值
  12. 微信公众平台账号迁移流程、申请函公证及留言功能开通方法
  13. 5个提供flickr高级图片搜索的网站
  14. 解决Rabbitmq连接超时问题
  15. 基于Opencv的开源的中文车牌识别系统
  16. Macbook Pro(MBP)上固态硬盘SSD,光驱位装HDD
  17. 用心邂逅美好,用爱守护童真
  18. 从特斯拉到爱因斯坦,物理学家为何钟情于猫
  19. 【太虚AR_v0.1】使用教程 | SLAM(Markerless)
  20. java英文介绍范文_java的英文自我介绍范文

热门文章

  1. oracle cdr是什么,基础:CDR软件中曲线工具的使用
  2. 十二个“一”的人物对比--《雪中悍刀行》
  3. 惠普打印机双击之后没有扫描_惠普打印机 找不到 扫描图标 怎么办,急需扫描一些证件 ,求救...
  4. 计算机音乐名侦探柯南简谱,《名侦探柯南》主题旋律|卡林巴琴简谱专用谱...
  5. Java中9种常见的CMS GC问题分析与解决
  6. linux下查看book文件夹,Linux初级入门百篇-find命令
  7. python写酒店管理系统_基于WEB的小型酒店管理系统,源码下载
  8. 本科毕业设计(论文)格式最详细总结
  9. c语言条件语句程序实例,c语言if(c语言if语句例子)
  10. Android 直播调研