lastfm数据集常用于推荐系统,在这里对lastfm做一个简单的整理,方便查看理解该数据集。

lastfm

数据集
Last.fm Dataset - 1K users
原链接似乎失效了。
这里放上某盘链接:
链接: https://pan.baidu.com/s/1v1HDy5DsjrTWNpwnP5QACg
提取码: pa7i

数据集说明
lastfm是关于用户听歌序列的数据集。作为有上下文信息的隐性反馈数据集的代表。它有两个文件,听歌记录与用户信息。前者为近1000位听众至2009年5月5日为止的所有音乐播放记录与播放时间,以及音乐的title、artist name、musicbrain id等信息。后者则记录了所有听众的性别、年龄、国家、注册时间的信息。其中听歌记录的统计数字如下:

  • Total Lines: 19,150,868
  • Unique Users: 992
  • Artists with MBID: 107,528
  • Artists with MBDID: 69,420

文件
userid-timestamp-artid-artname-traid-traname.tsv
userid-profile.tsv

数据格式
数据使用\t分割(数据可能存在缺失,用empty指代)。
userid-timestamp-artid-artname-traid-traname.tsv

userid \t timestamp \t musicbrainz-artist-id \t artist-name \t musicbrainz-track-id \t track-name

userid-profile.tsv:

userid \t gender (‘m’|‘f’|empty) \t age (int|empty) \t country (str|empty) \t signup (date|empty)

示例
userid-timestamp-artid-artname-traid-traname.tsv(无表头):
user_000001 \t 2009-05-04T23:08:57Z \t f1b1cf71-bd35-4e99-8624-24a6e15f133a \t Deep Dish \t\t Fuck Me Im Famous (Pacha Ibiza)-09-28-2007
user_000001 \t 2009-05-04T13:54:10Z \t a7f7df4a-77d8-4f12-8acd-5c60c93f4de8 \t 坂本龍一 \t\t Composition 0919 (Live_2009_4_15)
user_000001 \t 2009-05-04T13:52:04Z \t a7f7df4a-77d8-4f12-8acd-5c60c93f4de8 \t 坂本龍一 \t\t Mc2 (Live_2009_4_15)
user_000001 \t 2009-05-04T13:42:52Z \t a7f7df4a-77d8-4f12-8acd-5c60c93f4de8 \t 坂本龍一 \t\t Hibari (Live_2009_4_15)
user_000001 \t 2009-05-04T13:42:11Z \t a7f7df4a-77d8-4f12-8acd-5c60c93f4de8 \t 坂本龍一 \t\t Mc1 (Live_2009_4_15)
user_000001 \t 2009-05-04T13:38:31Z \t a7f7df4a-77d8-4f12-8acd-5c60c93f4de8 \t 坂本龍一 \t\t To Stanford (Live_2009_4_15)
user_000001 \t 2009-05-04T13:33:28Z \t a7f7df4a-77d8-4f12-8acd-5c60c93f4de8 \t 坂本龍一 \t\t Improvisation (Live_2009_4_15)
user_000001 \t 2009-05-04T13:23:45Z \t a7f7df4a-77d8-4f12-8acd-5c60c93f4de8 \t 坂本龍一 \t\t Glacier (Live_2009_4_15)
user_000001 \t 2009-05-04T13:19:22Z \t a7f7df4a-77d8-4f12-8acd-5c60c93f4de8 \t 坂本龍一 \t\t Parolibre (Live_2009_4_15)
user_000001 \t 2009-05-04T13:13:38Z \t a7f7df4a-77d8-4f12-8acd-5c60c93f4de8 \t 坂本龍一 \t\t Bibo No Aozora (Live_2009_4_15)

userid-profile.tsv(有表头):
id gender age country registered
user_000001 \t m \t \t Japan \t Aug 13, 2006
user_000002 \t f \t \t Peru \t Feb 24, 2006
user_000003 \t m \t 22 \t United States \t Oct 30, 2005
user_000004 \t f \t \t \t Apr 26, 2006
user_000005 \t m \t \t Bulgaria \t Jun 29, 2006
user_000006 \t \t 24 \t Russian Federation \t May 18, 2006
user_000007 \t f \t \t United States \t Jan 22, 2006
user_000008 \t m \t 23 \t Slovakia \t Sep 28, 2006
user_000009 \t f \t 19 \t United States \t Jan 13, 2007

lastfm 1k user 数据集简介相关推荐

  1. Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略

    Dataset之WebVision:WebVision数据集简介.下载.使用方法之详细攻略 目录 WebVision数据集简介 1.WebVision数据集挑战 WebVision数据集下载 WebV ...

  2. Dataset之Fashion-MNIST:Fashion-MNIST数据集简介、下载、使用方法之详细攻略

    Dataset之Fashion-MNIST:Fashion-MNIST数据集简介.下载.使用方法之详细攻略 目录 Fashion-MNIST数据集简介 1.Why we made Fashion-MN ...

  3. Dataset之Handwritten Digits:Handwritten Digits(手写数字图片识别)数据集简介、安装、使用方法之详细攻略

    Dataset之Handwritten Digits:Handwritten Digits(手写数字图片识别)数据集简介.安装.使用方法之详细攻略 目录 Handwritten Digits数据集的简 ...

  4. Dataset之Rotten Tomatoes:Rotten Tomatoes影评数据集简介、下载、使用方法之详细攻略

    Dataset之Rotten Tomatoes:Rotten Tomatoes影评数据集简介.下载.使用方法之详细攻略 目录 Rotten Tomatoes影评数据集简介 Rotten Tomatoe ...

  5. Dataset之CIFAR-10:CIFAR-10数据集简介、下载、使用方法之详细攻略

    Dataset之CIFAR-10:CIFAR-10数据集简介.下载.使用方法之详细攻略 目录 CIFAR-10简介 1.与MNIST 数据集中目比, CIFAR-10 真高以下不同点 2.Tensor ...

  6. Dataset之MNIST:MNIST(手写数字图片识别+ubyte.gz文件)数据集简介、下载、使用方法(包括数据增强)之详细攻略

    Dataset之MNIST:MNIST(手写数字图片识别+ubyte.gz文件)数据集简介+数据增强(将已有MNIST数据集通过移动像素上下左右的方法来扩大数据集为初始数据集的5倍) 目录 MNIST ...

  7. kitti数据集简介、百度网盘分享 kitti-object、kitti-tracking 全套数据集 自动驾驶

    0 写在前面 最近在学习MOT相关知识,之前暑期实习是在一家自动驾驶公司,公司资料里已经有了kitti数据集,所以直接用的,并没有去下载.但是最近自己在学校也用到了这个数据集,所以就去官网下载了,结果 ...

  8. 【深度学习】Fashion-MNIST数据集简介

    文章目录 数据集简介 操作 下载数据集 数据格式 可视化显示 读取小批量 完整代码 备注 数据集简介 不同于MNIST手写数据集,Fashion-MNIST数据集包含了10个类别的图像,分别是:t-s ...

  9. fer2013人脸表情数据集简介

    fer2013人脸表情数据集简介 fer2013人脸表情数据集由35886张人脸表情图片组成,其中,测试图(Training)28708张,公共验证图(PublicTest)和私有验证图(Privat ...

最新文章

  1. JVM 中的守护线程
  2. Redis命令参考简体中文版
  3. linux 软链接_Liunx 命令之链接操作
  4. wxWidgets:wxInitDialogEvent类用法
  5. wp java_Java WordPress工具库wp-client
  6. 【Spark】SparkStreaming-Kafka-Redis-集成-基础参考资料
  7. BZOJ-1045 糖果传递
  8. latex 幻灯片演示模板
  9. 【转】职业生涯30年的规划(经典)
  10. 送书 | 一本针对零基础 AI 学习的书:Python入门到人工智能实战
  11. 集成学习 Ensemble Learing(???)
  12. maven eclipse操作
  13. 设计模式入门,工厂模式,c++代码实现
  14. SQL中Case的使用方法(上篇)
  15. scm中mysql作用_scm供应链管理的作用
  16. 局域网技术,涉及到VLAN,TRUNK,链路聚合,VLAN间路由,单臂路由,
  17. 黑金开发板液晶显示图片
  18. mysql五日均线_怎么设置五日均线?
  19. 基于动态控制布谷鸟算法求解单目标优化问题(DDCS)附matlab代码
  20. 工作被拥抱变化了该怎么办?

热门文章

  1. Cookie到底是干什么的?
  2. 数据库集群技术(转载)
  3. SpringBoot模拟单点登录
  4. 【转载】R6034错误,C Runtime Error
  5. Linux开放80端口
  6. Realtek WiFi concurrent 模式介绍
  7. 不要盲目跟风:中小企业运营自媒体需三思而后行
  8. 2018年日常小计汇总
  9. 微信小程序wx.onLocationChange的使用,并计算移动距离
  10. 中国原盐产业发展现状分析,原盐主要应用于化工行业「图」