数据集下载地址:下载

摘要:MicroblogPCU是从新浪微博採集到的。它能够被用于研究机器学习方法和社会关系研究。

这个数据集被原作者用于探索微博中的spammers(发送垃圾信息的人)。他们的demo在这里

数据集的属性信息:

weibo_user.csv  
-user_id: 用户ID
-user_name: 用户昵称
-gender:性别,male,female。other
-class:账户级别
-message:账户注冊位置或其它个人信息
-post_num: 邮政编码
-follower_num: followers的数量
-followee_num: followee的数量
-follow ratio: followee_num/follower_num;
-is_spammer: manually annotated label, 1 表示 spammer,0 表示 non-spammer;

user_post.csv 
-post_id:微博的ID
-post_time:公布时间
-poster_id: 公布用户的ID
-repost_num:转发数量
-commnet_num: 评论数量

followe-followee.csv 
-follower: the nickname of follower;
-follower_id: the user ID of follower;
-followee: the nickname of followee;
-followee_id: the user ID of followee;

post.csv和user_post.csv类似, and the post in it are retrievalled by a certain key word related to a topic;

取出当中的一部分数据做关系图

install.packages('igraph')
library(igraph)follower_followee<-read.csv('microblogPCU/follower_followee.csv')
follower_followee_part<-follower_followee[1:1000,]gg<-graph.data.frame(data.frame(er=follower_followee_part$follower_id,ee=follower_followee_part$followee_id))
plot(gg,vertex.label=NA,      ##不显示标签edge.arrow.mode='-',  ##不使用箭头vertex.size = 5       ##设置结点圆的大小)

參考:https://archive.ics.uci.edu/ml/datasets/microblogPCU

转载请注明出处:http://blog.csdn.net/zhyoulun/article/details/46442899

[数据集]新浪微博数据集MicroblogPCU相关推荐

  1. 无人驾驶常用数据集---图像语义分割数据集--Cityscapes数据集的解读(for 小白)

    ** 无人驾驶常用数据集–图像语义分割数据集–Cityscapes数据集的解读(for 小白) ** 一.什么是Cityscapes数据集? Cityscapes是关于城市街道场景的语义理解图片数据集 ...

  2. 表格开源的数据集FUSD数据集、TableBank数据集、DocBank数据集

    FUSD数据集FUSD数据集 TableBank数据集 TableBank数据集 DocBank数据集 DocBank数据集 RVL-CDIP数据集 RVL-CDIP数据集

  3. VOC2007数据集 VOC2012数据集下载 百度云

    VOC2007数据集 VOC2007数据集下载 百度云 Download VOC2007 trainval & test 链接:https://pan.baidu.com/s/1_uTFp4_ ...

  4. YOLO v5 实现目标检测(参考数据集自制数据集)

    YOLO v5 实现目标检测(参考数据集&自制数据集) Author: Labyrinthine Leo   Init_time: 2020.10.26 GitHub: https://git ...

  5. DENSE 数据集 - STF 数据集(CVPR 2020)

    DENSE 数据集 - STF 数据集 - Seeing Through Fog Without Seeing Fog: Deep Multimodal Sensor Fusion in Unseen ...

  6. 【数据集NO.1】最经典大规模、多样化的自动驾驶视频数据集——BDD100K数据集

    本专栏主要分享本人收集整理的深度学习数据集资源,供大家参考使用.一个合适的数据集是论文写作.科研成功的开始.栏目会先简要介绍数据集,然后分享数据集的链接.本文分享最经典大规模.多样化的自动驾驶视频数据 ...

  7. yolov5s 预训练模型_YOLO v5 实现目标检测(参考数据集自制数据集)

    YOLO v5 实现目标检测(参考数据集&自制数据集) Author: Labyrinthine Leo   Init_time: 2020.10.26 GitHub: https://git ...

  8. 『DL笔记』PascalVOC 数据集介绍+数据集标注工具!

    PascalVOC 数据集介绍+数据集标注工具! 文章目录 一.Challenge 1.1.数据集的主要任务 1.2.VOC2012文件夹 1.3.Annotations 1.4.ImageSets ...

  9. LLMs:ColossalChat相关的开源训练数据集简介(SFT指令微调数据集+奖励模型排序数据集+RLHF数据集)、RLHF算法实现的三个阶段(监督指令微调→训练奖励模型→RLHF训练模型→​​​

    LLMs:ColossalChat相关的开源训练数据集简介(SFT指令微调数据集+奖励模型排序数据集+RLHF数据集).RLHF算法实现的三个阶段(监督指令微调→训练奖励模型→RLHF训练模型→推理量 ...

  10. python划分数据集_Python数据集切分实例

    在处理数据过程中经常要把数据集切分为训练集和测试集,因此记录一下切分代码. ''' data:数据集 test_ratio:测试机占比 如果data为numpy.numpy.ndarray直接使用此代 ...

最新文章

  1. 卷积神经网络(CNN)代码实现(MNIST)解析
  2. 关于Spring的笔试题(一)
  3. 面试经历—广州YY(欢聚时代)
  4. 主成分分析的可视化展示
  5. 专访余承东:华为引领行业进步 折叠屏手机即将上市
  6. vuex 源码分析_Vuex源码解析(一):Module初始化
  7. Python 读取数据
  8. [干货]手把手教你写一个安卓app
  9. Pysot训练自己数据集前的预处理
  10. 理解LINQ预编译查询(Compiled LINQ)
  11. 【激光SLAM, ROS】激光畸变的校正
  12. 游戏编辑器制作(9)
  13. [20160213]关于ansi语法.txt
  14. Peer-to-Peer 综述
  15. Vue路由守卫(拦截)
  16. Vue脚手架创建步骤
  17. 机器人将“上岗”参与“中国天眼”运维
  18. 如何在EDUIS中导出ETL字幕模板_教大家Edius如何设置导出mp4格式视频
  19. OpenSuse常用命令操作笔记
  20. 零基础简单的乐理知识

热门文章

  1. HttpClient相关
  2. MyCAT实现MySQL的读写分离
  3. 关于静态事件 static event 的二三事
  4. Jquery 使用技巧总结
  5. 共享一款基于 jQuery 的多功能对话框插件 jBox,强不强大,用了才知道:)
  6. 如何在网页中播放FLV文件的代码
  7. Map的keyset() 方法和entrySet() 方法
  8. ios真机中Text组件出现多余边框
  9. 解决:Unable to execute dex: GC overhead limit exceeded
  10. C#自定义RSA加密解密及RSA签名和验证封装类