SMP_WEIBO_2016 微博用户画像 可视化(未完成)
这个数据集标注的用户有4467位,通过筛选,将网络范围缩小到标注用户以及与标注用户具有关注关系的用户,筛选后网络节点数量为445150个节点。首先观察网络的形态
工具:gephi
节点颜色:
节点大小由其HUB值决定。
可以看到并没有什么很明显的社团结构。而且从未标注节点的角度看,仅与相同loc相连接的未标注节点并不多。
如果是猜测角度出发,那么如果一个未标注节点的所有邻居都是一个Loc的,那么,这个未标注节点为同一种loc的可能性会比较大。
所以,选择未标注节点,节点的邻居为一种loc,节点边数最少为3,即最少连接三个已标注用户。网络参数为:节点数为6451,边数为14735。
初步观察可以发现具有大量未标注用户与已标注用户交织连接。当然也存在一些已标注用户没有关注用户与之相连接,原因自然是这个网络数据量仍然不全面,或者关注用户是 异质的。
初步断定这种因素下的未标注用户是否与所连接的节点是一致的。
使用openord工具,支持10亿以上的点,速度非常快
Graph Distance Report
Results: Diameter: 33
Radius: 0
Average Path length: 7.644273763632479
Algorithm: Ulrik Brandes, A Faster Algorithm for Betweenness Centrality, in Journal of Mathematical Sociology 25(2):163-177, (2001)
由图中也可以看出,标注用户以华东与华北为主。由图距离报告可以看出,是否符合“六度分隔”理论呢?
一些有趣的点
本来的想法呢是通过未标注数据来判断:是否与相同loc连接的节点loc也能够确定,但是没有这方面的数据。所以弃了。
如果想要在这个图上进一步的进行处理,可以使用边近似的方式 ,未标注点成为一条边,绕过未标注数据。
整个实现思路比较简单,代码就不上传了。欢迎有想法的小伙伴与我讨论,QQ22549524
SMP_WEIBO_2016 微博用户画像 可视化(未完成)相关推荐
- 手把手教你:基于Django的用户画像可视化系统
系列文章 第九章.手把手教你:个人信贷违约预测模型 第八章.手把手教你:基于LSTM的股票预测系统 第七章.手把手教你:基于深度残差网络(ResNet)的水果分类识别系统 目录 系列文章 一.项目简介 ...
- 微博 用户画像_分析用户画像?从微博数据采集开始!
想设计一款新的产品,你了解未来的用户是什么样吗?想提升服务质量,用户调研应该怎么做?想评估新功能上线效果,用户情感偏好你了解吗?有了用户画像,这些问题的答案就变得逐渐清晰起来. 那么关键问题来了,用户 ...
- 微博 用户画像_微博/抖音/快手/小红书/B站内容营销和粉丝画像研究
用户画像数据在市面上最难获得的一批数据,因为就算大部分咨询公司会对外公开趋势数据和大的宏观数据,一般不会公开用户画像数据,因为这部分的含金量最大,可以用于广告的投放,新媒体的预算分配,个人创业者平台的 ...
- 微博 用户画像_“肖战”被抵制?Python爬虫揭秘肖战粉丝的人群画像
前一阵子,由于肖战的"227事件"微博和朋友圈都被刷屏,起因在与肖战的粉丝发现在AO3作品库平台收录关于肖战的同人作品,认为该部作品影响了肖战的形象,遂向有关部门举报,最终告知知名 ...
- 万字用户画像标签体系建设分析指南!
转自:大数据梦想家 01 什么是用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特 ...
- 标签体系下的用户画像建设小指南
点击上方蓝色字体,选择"设为星标 一. 什么是用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信 ...
- 数据中台:基于标签体系的360°用户画像
作者丨石秀峰 全文共6375个字,建议阅读需18分钟 一.从"标签"说起 标签是用来标志您的产品目标和分类或内容,像是您给您的目标确定的关键字词,便于您自己和他人查找和定位自己目标 ...
- 从0-1构建用户画像数据分析流程
与其因为泯然众人而惶恐不已,不如在众生中觅得自我.--数据说·实操季 导读:大数据经过近几年的迅速发展,从基础设施建设到应用层面,主要有数据平台搭建及运维管理.数据仓库开发.上层应用的统计分析.报表生 ...
- MySQL实战演练——如何才能构建逾期用户画像?【数据可视化】
大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师.欢迎大家跟我一起走进数据分析的世界,一起学习! 感兴趣的朋友可以关注我或者我的数据分析专栏,里面有许多优质的文章跟大家分享哦. 目录 必 ...
- python 用户的画像可视化呈现技术_一人一车一面:解读汽车大数据用户画像背后的AI技术...
背景介绍 大数据 大数据主要有五个特征,我们称为5V特征:Volume(大量).Variety(多样).Value(价值).Velocity(速度).Veracity(质量). Volume(大量): ...
最新文章
- 计算机科学与技术专业导论_教育部最新公布!西安工业大学新增4个本科专业!...
- 关于DateTime和String转换的容易犯得错误
- 是什么摧毁了程序员的工作效率
- 四元数c语言,C + OpenGL四元数
- Nginx 的 Location 配置指令块
- Golang实践录:调用C++函数
- 普通二本,去了小公司,我也想改变
- MFC 鼠标光标资源 及 更换
- Spring中@DependsOn注解的作用及实现原理解析
- 图像分割与GAN网络
- TODS:从时间序列数据中检测不同类型的异常值
- 微信公众平台账号迁移流程、申请函公证及留言功能开通方法
- 5个提供flickr高级图片搜索的网站
- 解决Rabbitmq连接超时问题
- 基于Opencv的开源的中文车牌识别系统
- Macbook Pro(MBP)上固态硬盘SSD,光驱位装HDD
- 用心邂逅美好,用爱守护童真
- 从特斯拉到爱因斯坦,物理学家为何钟情于猫
- 【太虚AR_v0.1】使用教程 | SLAM(Markerless)
- java英文介绍范文_java的英文自我介绍范文
热门文章
- oracle cdr是什么,基础:CDR软件中曲线工具的使用
- 十二个“一”的人物对比--《雪中悍刀行》
- 惠普打印机双击之后没有扫描_惠普打印机 找不到 扫描图标 怎么办,急需扫描一些证件 ,求救...
- 计算机音乐名侦探柯南简谱,《名侦探柯南》主题旋律|卡林巴琴简谱专用谱...
- Java中9种常见的CMS GC问题分析与解决
- linux下查看book文件夹,Linux初级入门百篇-find命令
- python写酒店管理系统_基于WEB的小型酒店管理系统,源码下载
- 本科毕业设计(论文)格式最详细总结
- c语言条件语句程序实例,c语言if(c语言if语句例子)
- Android 直播调研