[数据集]新浪微博数据集MicroblogPCU
数据集下载地址:下载
摘要:MicroblogPCU是从新浪微博採集到的。它能够被用于研究机器学习方法和社会关系研究。
这个数据集被原作者用于探索微博中的spammers(发送垃圾信息的人)。他们的demo在这里
数据集的属性信息:
weibo_user.csv
-user_id: 用户ID
-user_name: 用户昵称
-gender:性别,male,female。other
-class:账户级别
-message:账户注冊位置或其它个人信息
-post_num: 邮政编码
-follower_num: followers的数量
-followee_num: followee的数量
-follow ratio: followee_num/follower_num;
-is_spammer: manually annotated label, 1 表示 spammer,0 表示 non-spammer;
user_post.csv
-post_id:微博的ID
-post_time:公布时间
-poster_id: 公布用户的ID
-repost_num:转发数量
-commnet_num: 评论数量
followe-followee.csv
-follower: the nickname of follower;
-follower_id: the user ID of follower;
-followee: the nickname of followee;
-followee_id: the user ID of followee;
post.csv和user_post.csv类似, and the post in it are retrievalled by a certain key word related to a topic;
取出当中的一部分数据做关系图
install.packages('igraph')
library(igraph)follower_followee<-read.csv('microblogPCU/follower_followee.csv')
follower_followee_part<-follower_followee[1:1000,]gg<-graph.data.frame(data.frame(er=follower_followee_part$follower_id,ee=follower_followee_part$followee_id))
plot(gg,vertex.label=NA, ##不显示标签edge.arrow.mode='-', ##不使用箭头vertex.size = 5 ##设置结点圆的大小)
參考:https://archive.ics.uci.edu/ml/datasets/microblogPCU
转载请注明出处:http://blog.csdn.net/zhyoulun/article/details/46442899
[数据集]新浪微博数据集MicroblogPCU相关推荐
- 无人驾驶常用数据集---图像语义分割数据集--Cityscapes数据集的解读(for 小白)
** 无人驾驶常用数据集–图像语义分割数据集–Cityscapes数据集的解读(for 小白) ** 一.什么是Cityscapes数据集? Cityscapes是关于城市街道场景的语义理解图片数据集 ...
- 表格开源的数据集FUSD数据集、TableBank数据集、DocBank数据集
FUSD数据集FUSD数据集 TableBank数据集 TableBank数据集 DocBank数据集 DocBank数据集 RVL-CDIP数据集 RVL-CDIP数据集
- VOC2007数据集 VOC2012数据集下载 百度云
VOC2007数据集 VOC2007数据集下载 百度云 Download VOC2007 trainval & test 链接:https://pan.baidu.com/s/1_uTFp4_ ...
- YOLO v5 实现目标检测(参考数据集自制数据集)
YOLO v5 实现目标检测(参考数据集&自制数据集) Author: Labyrinthine Leo Init_time: 2020.10.26 GitHub: https://git ...
- DENSE 数据集 - STF 数据集(CVPR 2020)
DENSE 数据集 - STF 数据集 - Seeing Through Fog Without Seeing Fog: Deep Multimodal Sensor Fusion in Unseen ...
- 【数据集NO.1】最经典大规模、多样化的自动驾驶视频数据集——BDD100K数据集
本专栏主要分享本人收集整理的深度学习数据集资源,供大家参考使用.一个合适的数据集是论文写作.科研成功的开始.栏目会先简要介绍数据集,然后分享数据集的链接.本文分享最经典大规模.多样化的自动驾驶视频数据 ...
- yolov5s 预训练模型_YOLO v5 实现目标检测(参考数据集自制数据集)
YOLO v5 实现目标检测(参考数据集&自制数据集) Author: Labyrinthine Leo Init_time: 2020.10.26 GitHub: https://git ...
- 『DL笔记』PascalVOC 数据集介绍+数据集标注工具!
PascalVOC 数据集介绍+数据集标注工具! 文章目录 一.Challenge 1.1.数据集的主要任务 1.2.VOC2012文件夹 1.3.Annotations 1.4.ImageSets ...
- LLMs:ColossalChat相关的开源训练数据集简介(SFT指令微调数据集+奖励模型排序数据集+RLHF数据集)、RLHF算法实现的三个阶段(监督指令微调→训练奖励模型→RLHF训练模型→
LLMs:ColossalChat相关的开源训练数据集简介(SFT指令微调数据集+奖励模型排序数据集+RLHF数据集).RLHF算法实现的三个阶段(监督指令微调→训练奖励模型→RLHF训练模型→推理量 ...
- python划分数据集_Python数据集切分实例
在处理数据过程中经常要把数据集切分为训练集和测试集,因此记录一下切分代码. ''' data:数据集 test_ratio:测试机占比 如果data为numpy.numpy.ndarray直接使用此代 ...
最新文章
- 卷积神经网络(CNN)代码实现(MNIST)解析
- 关于Spring的笔试题(一)
- 面试经历—广州YY(欢聚时代)
- 主成分分析的可视化展示
- 专访余承东:华为引领行业进步 折叠屏手机即将上市
- vuex 源码分析_Vuex源码解析(一):Module初始化
- Python 读取数据
- [干货]手把手教你写一个安卓app
- Pysot训练自己数据集前的预处理
- 理解LINQ预编译查询(Compiled LINQ)
- 【激光SLAM, ROS】激光畸变的校正
- 游戏编辑器制作(9)
- [20160213]关于ansi语法.txt
- Peer-to-Peer 综述
- Vue路由守卫(拦截)
- Vue脚手架创建步骤
- 机器人将“上岗”参与“中国天眼”运维
- 如何在EDUIS中导出ETL字幕模板_教大家Edius如何设置导出mp4格式视频
- OpenSuse常用命令操作笔记
- 零基础简单的乐理知识