MovieLens推荐系统数据集官方文档+解释
参见和下载地址:https://grouplens.org/datasets/movielens/
MovieLens
GroupLens Research已从MovieLens网站(http://movielens.org)收集并提供评级数据集。根据集合的大小,在不同的时间段收集数据集。在使用这些数据集之前,请查看其README文件以获取使用许可证和其他详细信息。
帮助我们的研究实验室:请对MovieLens数据集进行简短的调查 https://docs.google.com/forms/d/e/1FAIpQLSeCkt7cD5j7QexQZmY1cDHNMFUSaAzv_yPPVhwz1RNTh0Xa0Q/viewform?c=0&w=1
recommended for new research
MovieLens 20M Dataset
稳定的基准数据集。138,000名用户对27,000部电影打的2000万个评级和465,000个标签。包括标签基因组数据,在1,100个标签上有1200万个相关性分数。 2015年4月发布;更新10月2016以更新links.csv并添加标签基因组数据。
~README.html : http://files.grouplens.org/datasets/movielens/ml-20m-README.html
~ml-20m.zip(大小:190 MB,校验和)
recommended for education and development
MovieLens最新数据集
这些数据集将随时间而变化,不适合报告研究结果。我们将保持下载链接稳定以进行自动下载。我们不会存档或提供以前发布的版本。
小:对于9,000部电影,600个用户产生出100,000个评级和3,600个标签。上次更新时间:9/2018。
~README.html : http://files.grouplens.org/datasets/movielens/ml-latest-small-README.html
~ml-latest-small.zip(大小:1 MB)全部:对于58,000部电影,280,000个用户产生出27,000,000个评级和1,100,000个标签。包括标签基因组数据,包含1,100个标签的1400万个相关性分数。上次更新时间:9/2018。
~README.html : http://files.grouplens.org/datasets/movielens/ml-latest-README.html
~ml-latest.zip(大小:265 MB)
older datasets
MovieLens 100K数据集
稳定的基准数据集。来自1700部电影,1000名用户的100,000个评分。发布于4/1998。
~README.txt :http://files.grouplens.org/datasets/movielens/ml-100k-README.txt
~ml-100k.zip(大小:5 MB,校验和)
~解压缩文件的索引 :http://files.grouplens.org/datasets/movielens/ml-100k/MovieLens 1M数据集
稳定的基准数据集。 4000部电影的6000名用户获得100万评级。 2003年2月发布。
~README.txt
~ml-1m.zip(大小:6 MB,校验和)MovieLens 10M数据集
稳定的基准数据集。 72,000个用户对于10,000部电影,进行了1000万个评级和100,000个标签。发布于2009年1月1日。
~README.html
~ml-10m.zip(大小:63 MB,校验和)MovieLens标签基因组数据集
对于于10,000部电影的1,100个标签池中获得1100万个计算标签 - 电影相关性分数。发布于2014年3月。
还可以考虑使用MovieLens 20M或最新数据集,这些数据集还包含(更新的)标签基因组数据。
~README.html
~tag-genome.zip(大小:41 MB)
数据集解movieId, title, genres
其中均包含四个文件:movies.csv , links.csv , ratings.csv ,tags.csv
movies.csv (电影文件)
movieId:电影id
title:电影标题
genres:电影的题材(多种题材用|分割)
links.csv(链接文件)
movieId:电影在movielens上的id,通过https://movielens.org/movies/(movieId)访问
imdbId:电影在imdb网站上的id,通过http://www.imdb.com/title/(imdbId)访问
tmdbId:电影在themoviedb上的id,通过http://www.imdb.com/title/(tmdbId)访问
ratings.csv (评分文件)
userId: 用户id
movieId: 电影id
rating: 用户评分。5分制,0.5 stars - 5 stars,以0.5为间隔
timestamp: Unix时间戳,十位,精确到秒
tags.csv(标签文件)
userId: 用户id
movieId: 电影id
tag: 表示用户在某个时间为某个电影标记的标签,即分类
timestamp: 同上时间戳
MovieLens推荐系统数据集官方文档+解释相关推荐
- SlidesJS基本使用方法和官方文档解释 【Jquery幻灯片插件 Jquery相册插件】
SlidesJS基本使用方法和官方文档解释 [Jquery幻灯片插件 Jquery相册插件] 标签: jquery文档functionstringdiv相册 2012-04-19 15:23 3931 ...
- clickhouse官方文档_clickhouse分析:zookeeper减压概述
点击上方蓝字关注我们 " 使用复制表之后,随着数据量的增加,zookeeper是瓶颈?这个问题估计任何一个对ch关注的人都会看到,当然解决这个问题是需要花费较大精力的.本次我主要想分享ch官 ...
- RabbitMQ官方文档知识点总结合集+代码注释(中文+Java版)
全文代码.MD格式文档的github连接(求star~):https://github.com/Ruoyi-Chen/RabbitMQ-demos 文章目录 全文代码.MD格式文档的github连接( ...
- 写最好的Docker安装最新版MySQL8(mysql-8.0.31)教程(参考Docker Hub和MySQL官方文档)
一.前言 MySQL官方安装包下载地址: https://dev.mysql.com/downloads/mysql/ Docker Hub官方网址: https://hub.do ...
- 【TensorFlow官方文档】MNIST机器学习入门
MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片:它也包含每一张图片对应的标签,告诉我们这个是数字几.比如,下面这四张图片的标签分别是5,0,4,1. 从一个很简单的数学模型开始:训练 ...
- Sklearn官方文档中文整理4——随机梯度下降和最近邻篇
Sklearn官方文档中文整理4--随机梯度下降和最近邻篇 1. 监督学习 1.5. 随机梯度下降 1.5.1. 分类[linear_model.SGDClassifier] 1.5.2. 回归[li ...
- Mybatis官方文档及使用简记
Mybatis官方文档及使用简记 数据库建表 入门案例 无mapper类最传统的用法 使用mybatis generator 使用mybatis-generator mybatis-spring整合 ...
- Sklearn官方文档中文整理10——等式回归和神经网络模型(有监督)篇
Sklearn官方文档中文整理10--等式回归和神经网络模型(有监督)篇 1. 监督学习 1.15. 等式回归[isotonic.IsotonicRegression] 1.17. 神经网络模型(有监 ...
- Sklearn官方文档中文整理6——交叉分解,朴素贝叶斯和决策树篇
Sklearn官方文档中文整理6--交叉分解,朴素贝叶斯和决策树篇 1. 监督学习 1.8. 交叉分解[cross_decomposition.PLSRegression,cross_decompos ...
- Detectron2 官方文档详细解读 (上)
Detectron2解读全部文章链接: Facebook计算机视觉开源框架Detectron2学习笔记 - 从demo到训练自己的模型 Detectron2 "快速开始" Dete ...
最新文章
- 用于3D摄像头的VCSEL技术
- R语言使用Rtsne包进行TSNE分析:提取TSNE分析结果合并到原dataframe中、可视化tsne降维的结果、并圈定降维后不匹配的数据簇(tSNE identifying mismatch)
- suse linux 软件包安装,SUSE Linux 11系统rpm包离线安装GCC
- ajax.call失效无请求,移动端ajax请求问题?
- SVN的使用及MyEclipse的集成
- c语言中文网GUI,golang gui介绍
- CSS实现文本居中和块级元素居中
- 职场内耗,正在让这个团队瓦解
- strictmath_Java StrictMath cbrt()方法与示例
- 吴恩达 深度学习系列--卷积神经网络(Convolutional Neural Networks)-03(目标检测)
- Android 汇集CSDN、GitHub等最实用的良心之作-KING
- 平衡二叉排序树--调整方法快速记忆方法(渣男丢妻弃子法)
- SL-PCA(子空间学习模型)——前景提取
- 修改IDA pdb下载目录的方法(已实践)
- define AR_DLL_API __declspec(dllexport) 问题
- 解决论坛内吾爱破解专用虚拟机系统不能安装VMwaretools问题!
- PAT乙级095 解码PAT准考证
- 30岁+的人如何进行自我提升和职场规划
- 2009年圣诞节100条手机短信
- bs4.FeatureNotFound: Couldn‘t find a tree builder with the features you requested: lxml. Do you need