1.数据集的组成

此数据集是将一些其他的数据集联系起来之后得到的一个数据集。
其他的数据集分为两类,分别是推荐系统的数据集和知识库。推荐系统的数据集(RS data sets),包括MovieLens, LFM-1b和Amazon book三种;知识库的数据集( KB data sets),包括Freebase和YAGO。

将来自推荐系统的三个数据集分别与来自知识库的两个数据集相联系,形成六个联系结果。
将以上数据集联系起来的主要思想是:根据RS data sets的项目标题与KB data sets相连接。(类似于数据库中的自然连接)
但最终在KB4Rec v1.0数据集中只提供了由推荐系统的数据集连接到Freebase的三个数据文件:ml2fb.txt、lfb2fb.txt、ab2fb.txt。

2.数据集的作用

由于推荐系统的三个数据集MovieLens, LFM-1b和Amazon book分别包含了电影、音乐、图书三大类,以及知识库的两个数据集Freebase和YAGO中包含大量的项目信息,所以KB4Rec包含丰富的知识库(KB)信息,可以为推荐系统提供丰富和结构化的知识库(KB)信息,使训练出的推荐模型具有更好的推荐效果。

在原论文(原论文地址)中,数据集的创建者对数据集KB4Rec进行了一系列的实验验证,如在KB4Rec的基础上比较不同的推荐算法,结果表明,KB4Rec是可行且有价值的。

另,笔者在毕业论文中采用了上文中提到的MovieLens数据集,在论文的总结与展望章节中,分析了采用的数据集具有一定的片面性。而KB4Rec数据集正好可以解决这个问题。

3.数据集的使用

数据集的创建者将KB4Rec发布在了GitHub上(数据集地址),可在GitHub中通过相应的代码调用数据集:

@article{Zhao-DI-2019,author = {Wayne Xin Zhao andGaole He andKunlin Yang andHong{-}Jian Dou andJin Huang and Siqi Ouyang andJi{-}Rong Wen},title = {KB4Rec: A Data Set for Linking Knowledge Bases with Recommender Systems},journal = {Data Intelligence},volume = {1},number = {2},pages = {121-136},year = {2019},doi = {10.1162/dint\_a\_00008},URL = {https://doi.org/10.1162/dint_a_00008},
}@inproceedings{huang-SIGIR-2018,author    = {Jin Huang andWayne Xin Zhao andHong{-}Jian Dou andJi{-}Rong Wen andEdward Y. Chang},title     = {Improving Sequential Recommendation with Knowledge-Enhanced Memory Networks}booktitle = {The 41st International {ACM} {SIGIR} Conference on Research {\&}Development in Information Retrieval, {SIGIR} 2018, Ann Arbor, MI,USA, July 08-12, 2018}pages     = {505--514}year      = {2018},url       = {http://doi.acm.org/10.1145/3209978.3210017},doi       = {10.1145/3209978.3210017},
}@inproceedings{Zhao-PAKDD-2019,author    = {Wayne Xin Zhao andHong{-}Jian Dou andYuanpei Zhao andDaxiang Dong andJi{-}Rong Wen},title     = {Neural Network Based Popularity Prediction by Linking Online Contentwith Knowledge Bases},booktitle = {Advances in Knowledge Discovery and Data Mining - 23rd Pacific-AsiaConference, {PAKDD} 2019, Macau, China, April 14-17, 2019, Proceedings,Part {II}},pages     = {16--28},year      = {2019},crossref  = {DBLP:conf/pakdd/2019-2},url       = {https://doi.org/10.1007/978-3-030-16145-3\_2},doi       = {10.1007/978-3-030-16145-3\_2},
}

最后,由于对GitHub尚未完全熟悉,有待进一步的实验验证。
并且,可能由于网络的原因,无法下载KB4Rec数据集。

关于对KB4Rec数据集的学习相关推荐

  1. DL之RBM:(sklearn自带数据集为1797个样本*64个特征+5倍数据集)深度学习之BRBM模型学习+LR进行分类实现手写数字图识别

    DL之RBM:(sklearn自带数据集为1797个样本*64个特征+5倍数据集)深度学习之BRBM模型学习+LR进行分类实现手写数字图识别 目录 输出结果 实现代码 输出结果 实现代码 from _ ...

  2. 无需在数据集上学习和预训练,这种图像修复新方法效果惊人 | 论文

    林鳞 编译自 Github 量子位 出品 | 公众号 QbitAI Reddit上又炸了,原因是一个无需在数据集上学习和预训练就可以超分辨率.修补和去噪的方法:Deep image prior. 帖子 ...

  3. 基于自动图像分割算法和扩展数据集深度学习的经济作物病害识别

    基于自动图像分割算法和扩展数据集深度学习的经济作物病害识别 1.作物病害识别出现的问题 实际应用中作物图像的复杂背景信息和训练数据不足会导致深度学习的错误识别. 2.研究内容 提出了一种基于自动图像分 ...

  4. 体验AI乐趣:基于AI Gallery的二分类猫狗图片分类小数据集自动学习

    摘要:直接使用AI Gallery里面现有的数据集进行自动学习训练,很简单和方便,节约时间,不用自己去训练了,AI Gallery 里面有很多类似的有趣数据集,也非常好玩,大家一起试试吧. 本文分享自 ...

  5. GIS影像数据集初步学习

    使用超图桌面版打开一个在线地图: 这是在线发布的: 点击地图左下角 打开服务: 可在本地看到对应的数据集: 看一下数据集的属性:这是影像类型的数据集:影像数据集并不对应一张表,右键没有 浏览属性表 的 ...

  6. tensorflow实现宝可梦数据集迁移学习

    目录 一.迁移学习简介 二.构建预训练模型 1.调用内置模型 2.修改模型 3.构建模型 三.导入数据和预处理 1.设置batch size 2.读取训练数据 3.读取验证数据 4.读取测试数据 5. ...

  7. detectron2训练自己的数据集_TensorFlow2学习十五、使用VGG16模型训练自己的数据集...

    一.说明 VGG16在2014年ImageNet比赛中获胜.ImageNet数据集中有1000个图像属于1000个不同的类别. VGG模型的权重是免费的,可以在您自己的模型和应用程序中加载和使用.这使 ...

  8. 《南溪的目标检测学习笔记》——COCO数据集的学习笔记

    1 COCO数据集 COCO数据集下载链接:COCO_download 1.1 数据概览 数据集大小 train: 118287张 train+val: 123287张 val: 5000张 目标数量 ...

  9. 多元线性回归数据集_TensorFlow学习Program1——13.实现一元、多元线性回归(基于房价数据集)...

    本节将针对波士顿房价数据集的房间数量(RM)采用简单一元线性回归,目标是预测在最后一列(MEDV)给出的房价.波士顿房价数据集可从http://lib.stat.cmu.edu/datasets/bo ...

最新文章

  1. dedecms 财付通接口
  2. 胜者为王(比较字符串)
  3. Oracle导入csv数据字符集,用SQLLDR把.CSV文件导入到数据库时,出现无法定位字符集句柄以用于字符集标识(0)...
  4. 首个生物医疗开放大数据研究中心在沪成立
  5. linux svn添加新文件夹,linux svn 添加文件夹
  6. CriminalIntent项目开发--后篇
  7. SVM_GUI_3.1[mcode]{by faruto}的安装及使用
  8. 2.控制反转 spring_ioc
  9. java注解管理_JavaSpring【四、Bean管理注解实现】
  10. boa服务器怎样运行,boa服务器的配置与编译
  11. 如何删除多余系统引导项
  12. 基于主体掩码的实体关系抽取方法
  13. Java工作笔记-对反射的进一步理解
  14. eclipse工具栏sdk和avd图标
  15. C语言基础第三次作业
  16. arm-linux-gcc交叉编译器和gcc编译器的下载地址
  17. excel手机版_excel仓库管理手机版导出软件
  18. linux怎样入门,Linux新手如何入门?给新手的四点建议!
  19. 【Java后端】技术文档模板
  20. 永久免费的数据库防火墙(堡垒机)

热门文章

  1. Pikachu漏洞练习——暴力破解
  2. 页面卡顿的原因及排查
  3. 带你深入了解Java!十七、超市会员管理系统!
  4. Android Java 必备:Socket通信
  5. 安装PhotoShop报错 无法写入注册表值请检查权限(错误代码160)
  6. vue的methods属性的方法中出现回调函数,在回调函数内部获取data中的数据
  7. 【Python】三种连接数据库的方式
  8. 规则引擎Drools详细介绍
  9. “内卷之王”vivo:成败即将见分晓
  10. PHP数组去重/高德地图API