https://grouplens.org/datasets/movielens/

官网数据集地址

MovieLens

GroupLens Research已从MovieLens网站(http://movielens.org)收集并提供评级数据集。根据集合的大小,在不同的时间段收集数据集。在使用这些数据集之前,请查看其README文件以获取使用许可证和其他详细信息。


recommended for new research

MovieLens 25M Dataset

Movielens 25M电影评分。稳定的基准数据集。2500万个评分和一百万个标签应用程序将62,000部电影应用于162,000名用户。包括标记基因组数据,跨1,129标签的1500万相关性分数。发布12/2019.

  • Readme.txt.

  • ML-25M.zip(大小:250 MB,校验和链接)

https://files.grouplens.org/datasets/movielens/ml-25m-README.html

README.txt

https://files.grouplens.org/datasets/movielens/ml-25m.zip

ml-25m.zip

https://files.grouplens.org/datasets/movielens/ml-25m.zip.md5

ml-25m.zip校验和链接

永久链接:

https://grouplens.org/datasets/movielens/25m/

recommended for education and development

MovieLens最新数据集

这些数据集将随时间而变化,不适合报告研究结果。我们将保持下载链接稳定以进行自动下载。我们不会存档或提供以前发布的版本。

小:100,000家评级和3,600个标签应用程序应用于600个用户的9,000部电影。最后更新9/2018。

  • README.html

  • ml-latest-small.zip(大小:1 MB)

https://files.grouplens.org/datasets/movielens/ml-latest-small-README.html

README.html

https://files.grouplens.org/datasets/movielens/ml-latest-small.zip

ml-latest-small.zip

全部:27,000,000名评级和1,100,000个标签应用程序将58,000部电影应用于280,000名用户。包括标记基因组数据,跨1,100个标签的1400万相关分数。最后更新9/2018。

  • README.html

  • ml-latest.zip(大小:265 MB)

https://files.grouplens.org/datasets/movielens/ml-latest-small-README.html

README.html

https://files.grouplens.org/datasets/movielens/ml-latest.zip

ml-latest.zip

永久链接:

https://grouplens.org/datasets/movielens/latest/

synthetic datases

MOVIELENS 1B合成数据集

MOVIELENS 1B是一种合成数据集,从ML-20M的20万个真实额定值扩展,分布在MLPERF中。请注意,这些数据分发为.npz文件,您必须使用python和numpy读取。

  • README

  • ml-20mx16x32.tar (3.1 GB)

  • ML-25M.zip(大小:250 MB,校验和链接

https://files.grouplens.org/datasets/movielens/ml-20mx16x32-README.txt

README

https://files.grouplens.org/datasets/movielens/ml-20mx16x32.tar

ml-20mx16x32.tar

https://files.grouplens.org/datasets/movielens/ml-20mx16x32.tar.md5

ml-20mx16x32.tar.md5

此处提供扩展算法的代码要创建上面的数据集,我们运行了算法(使用提交1c6ae725a81d15437a2b2df05cac0673fde5c3a4),如自述文件所描述的“推荐基准的运行指令”部分中所述。

https://github.com/mlperf/training/tree/master/data_generation

扩展算法代码

永久链接:

https://grouplens.org/datasets/movielens/movielens-1b/

older datasets

MovieLens 100K数据集

稳定的基准数据集。来自1700部电影,1000名用户的100,000个评分。发布于4/1998。

  • README.txt   :

  • ml-100k.zip(大小:5 MB,校验和)

  • 解压缩文件的索引

https://files.grouplens.org/datasets/movielens/ml-100k-README.txt

README.txt

https://files.grouplens.org/datasets/movielens/ml-100k.zip

ml-100k.zip

https://files.grouplens.org/datasets/movielens/ml-100k.zip.md5

校验和链接

https://files.grouplens.org/datasets/movielens/ml-100k/

Index of unzipped files

永久链接:

https://grouplens.org/datasets/movielens/100k/

MovieLens 1M数据集

稳定的基准数据集。4000部电影的6000名用户获得100万评级。2003年2月发布。

  • README.txt

  • ml-1m.zip(大小:6 MB,校验和)

https://files.grouplens.org/datasets/movielens/ml-1m-README.txt

README.txt

https://files.grouplens.org/datasets/movielens/ml-1m.zip

ml-1m.zip

https://files.grouplens.org/datasets/movielens/ml-1m.zip.md5

校验和链接

永久链接:

https://grouplens.org/datasets/movielens/1m/

MovieLens 10M数据集

稳定的基准数据集。72,000个用户对于10,000部电影,进行了1000万个评级和100,000个标签。发布于2009年1月1日。

  • README.html

  • ml-10m.zip(大小:63 MB,校验和)

https://files.grouplens.org/datasets/movielens/ml-10m-README.html

README.txt

https://files.grouplens.org/datasets/movielens/ml-10m.zip

ml-10m.zip

https://files.grouplens.org/datasets/movielens/ml-10m.zip.md5

校验和链接

永久链接:

https://grouplens.org/datasets/movielens/10m/

MovieLens 20M数据集

Movielens 20M电影评分。稳定的基准数据集。使用2000万辆和465,000个标签应用程序适用于138,000名用户的27,000部电影。包括标记基因组数据,跨1,100个标签的1200万相关性分数。发布4/2015;更新10/2016以更新Links.csv并添加标记基因组数据。

  • README.html

  • ml-10m.zip(大小:63 MB,校验和)

https://files.grouplens.org/datasets/movielens/ml-20m-README.html

README.txt

https://files.grouplens.org/datasets/movielens/ml-20m.zip

ml-20m.zip

https://files.grouplens.org/datasets/movielens/ml-20m.zip.md5

校验和链接

也可以查看MovieLens 20M YouTube预告片数据集,链接:https://grouplens.org/datasets/movielens/20m-youtube/以获得在YouTube上托管的MovieLens电影和电影预告片之间的链接。

永久链接:

https://grouplens.org/datasets/movielens/20m/


MovieLens标签基因组数据集

对于于10,000部电影的1,100个标签池中获得1100万个计算标签 - 电影相关性分数。发布于2014年3月。

还可以考虑使用MovieLens 20M或最新数据集,这些数据集还包含(更新的)标签基因组数据。

  • README.html

  • tag-genome.zip(大小:41 MB)

https://files.grouplens.org/datasets/tag-genome/README.html

README.html

https://files.grouplens.org/datasets/tag-genome/tag-genome.zip

tag-genome.zip

永久链接:

https://grouplens.org/datasets/movielens/tag-genome/


数据集解movieId, title, genres

其中均包含四个文件:movies.csv  , links.csv  , ratings.csv  ,tags.csv

movies.csv (电影文件)

movieId:电影id 
title:电影标题  genres:电影的题材(多种题材用|分割)

links.csv(链接文件)

movieId:电影在movielens上的id

通过https://movielens.org/movies/(movieId)访问

imdbId:电影在imdb网站上的id

通过http://www.imdb.com/title/(imdbId)访问

tmdbId:电影在themoviedb上的id

通过http://www.imdb.com/title/(tmdbId)访问

ratings.csv (评分文件)

userId: 用户id 
movieId: 电影id 
rating: 用户评分。5分制,0.5 stars - 5 stars,以0.5为间隔 timestamp: Unix时间戳,十位,精确到秒

tags.csv(标签文件)

userId: 用户id 
movieId: 电影id 
tag: 表示用户在某个时间为某个电影标记的标签,即分类 timestamp: 同上时间戳

MovieLens官网数据集解释相关推荐

  1. MS COCO数据集人体关键点评估(Keypoint Evaluation)(来自官网)

    COCO系列文章: MS COCO数据集目标检测评估(Detection Evaluation)(来自官网) MS COCO数据集人体关键点评估(Keypoint Evaluation)(来自官网) ...

  2. Kudu安装(官网推荐的步骤)(installing Kudu using parcels or packages)

    不多说,直接上干货! Kudu安装前的建议说明(博主推荐) Kudu官网推荐的步骤: 本篇博文是installing Kudu using parcels or packages的方式. http:/ ...

  3. IO系列学习总结六:拜读Netty 4.x版本官网,熟悉官网discard protocol time protocol

    前言 对于Netty这种通讯框架而言,它最简单的一个实现(也就是我们常说的Hello World程序)也得需要客户端和服务端进行通讯,而这实际上就是一种协议.在Netty官网中有提到,最简单的协议实现 ...

  4. 2、spring的官网

    1.spring官网地址 https://spring.io 2.官网名词解释 ·Microsevices:微服务 ·Reactive:反应式编程 ·Cloud:云服务 ·Web apps:web开发 ...

  5. Pytorch:使用官网提供数据集的相关参数设置,以CIFAR10为例进行说明

    文章目录 前言 一.Dataset 定义-组成 分类 二.获取数据集 1.参数说明 2.相关Demo 前言 本文记录笔者关于Dataset的相关学习记录,以Pytorch官网文档为主进行学习 一.Da ...

  6. pytorch实现:Resnet模型识别花朵数据集(参考pytorch官网代码)

    pytorch实现:Resnet模型识别花朵数据集 一.pytorch实现:Resnet模型识别花朵数据集 1.1 训练模型 1.2 图像预测和可视化 1.3 对新来的数据进行处理和展示 一.pyto ...

  7. MySQL中varchar最大长度是多少(真正的官网解释,事实说话)

    Mysql5.6 字符集 utf8mb4 中varcha的长度最大为15936 使用二分法试出来的(见下图) 经过反复测试,最大值那个错误,官网说法最大值是65535bytes,utf8mb4每个字符 ...

  8. 讲解TIDB中官网没有详细解释的地方

    由于TIDB的官网讲解的不够详细,导致实际安装TIDB的过程中会出现一些问题,针对自己遇到过的问题,做出详细的说明使用的安装文档是2020-01-04还在线的安装文档,如果你执行的命令与我所执行的命令 ...

  9. TensorFlow官网教程Convolutional Neural Networks 难点详解

    前言 断断续续花了几周的时间,终于把Tensorflow的学习教程Convolutional Neural Networks实现了.因为是深度学习的入门级小白,所以中间费了不少周折. 网上关于这个教程 ...

  10. zoom视频会议官网_人性化视频会议的空间(Zoom等)

    zoom视频会议官网 第二部分:房间的创造力 (Part Two: The Creativity of Rooms) In Part One I shared thoughts on how virt ...

最新文章

  1. java内部类的权限符,static介绍、内部类、final、权限修饰符的作用范围,
  2. img 在video上面_HTML,img,video无法铺满屏幕解决方法,同视频做网页背景无法全屏的解决方法...
  3. TensorFlow练习27: 验证码生成器-从文本生成图像
  4. 多返回值函数的编写方法
  5. 【星球知识卡片】深度学习图像降噪有哪些关键技术点,如何学习
  6. nginx 获取body参数_分布式实战:Nginx缓存之流量分发层
  7. JVM插桩之四:Java动态代理机制的对比(JDK和CGLIB,Javassist,ASM)
  8. python链式赋值与C++赋值的结果比较与分析
  9. python的opencv 车牌识别 开源_毕节进出口车牌识别系统怎么样
  10. html页面怎么引用通用的头部,html 如何引入一个公共的头部和底部
  11. mysql 错误编码_【分享】MySQl操作系统提示错误编码
  12. Windows多网口内外网设置
  13. 黑马程序员Python教程的代码--植物大战僵尸游戏代码
  14. 计算机考研英语资料推荐,2016考研计算机专业备考资料推荐
  15. shell中变量截取
  16. 20.数据集成、数据整合、数据融合
  17. python重命名异常_Python:如何忽略异常并继续?
  18. 内网通过代理服务器访问高德地图服务的方法
  19. 【CODE】Longest Substring Without Repeating Characters
  20. Python 爬虫之 Beautifulsoup4,爬网站图片

热门文章

  1. Mac下Android 反编译
  2. 串口通信工具android,串口调试工具手机版
  3. maxwell生成动态磁力线/磁密云图一些报错警告解决办法
  4. 实对称矩阵的特征向量矩阵为酉矩阵
  5. 四、云计算-国产-华为-运维、灾备和迁移+HCIE Cloud相关知识点+笔试题库
  6. 计算机主板光驱插口,如何查看笔记本光驱位和主板的SATA接口版本
  7. Ubuntu系统安装分区
  8. ECharts常用图表(柱状图)
  9. 零基础可入门的Python,为什么有些人自学几天就放弃了?
  10. Java、JSP教务排课系统