原文:

Wine Reviews

130k wine reviews with variety, location, winery, price, and description

After watching Somm (a documentary on master sommeliers) I wondered how I could create a predictive model to identify wines through blind tasting like a master sommelier would. The first step in this journey was gathering some data to train a model. I plan to use deep learning to predict the wine variety using words in the description/review. The model still won't be able to taste the wine, but theoretically it could identify the wine based on a description that a sommelier could give. If anyone has any ideas on how to accomplish this, please post them!

This dataset contains three files:

  • winemag-data-130k-v2.csv contains 10 columns and 130k rows of wine reviews.

  • winemag-data_first150k.csv contains 10 columns and 150k rows of wine reviews.

  • winemag-data-130k-v2.json contains 6919 nodes of wine reviews.

Click on the data tab to see individual file descriptions, column-level metadata and summary statistics.

译:

葡萄酒评论

130k葡萄酒评论,包括品种、位置、酒庄、价格和描述

在看了Somm(一部关于大师侍酒师的纪录片)之后,我想知道如何创建一个预测模型,通过盲品来识别葡萄酒,就像一个大师级的侍酒师一样。这个旅程的第一步是收集一些数据来训练模型。我计划用深入的学习来预测葡萄酒的品种,在描述/评论中使用单词。该模型仍然无法品尝葡萄酒,但理论上它可以根据品酒师的描述来识别葡萄酒。如果有人对如何做到这一点有任何想法,请发表他们!

此数据集包含三个文件:

  • winemag-data-130k-v2.csv包含10列和130k行葡萄酒评论。

  • winemag-data_first150k.csv包含10列和15万行葡萄酒评论。

  • winemag-data-130k-v2.json包含6919个葡萄酒评论节点。

单击“数据”选项卡以查看单个文件说明、列级元数据和摘要统计信息。

大家可以到官网地址下载数据集,我自己也在百度网盘分享了一份。可关注本人公众号,回复“2020101703”获取下载链接。

Wine Reviews(葡萄酒评论相关数据集)相关推荐

  1. 【深度学习】机器学习\深度学习常见相关公开数据集汇总(图像处理相关数据集、自然语言处理相关数据集、语音处理相关数据集)

    一.前言 1. 介绍 常来说,深度学习的关键在于实践.从图像处理到语音识别,每一个细分领域都有着独特的细微差别和解决方法. 然而,你可以从哪里获得这些数据呢?现在大家所看到的大部分研究论文都用的是专有 ...

  2. 6.1 葡萄酒评论分析报告

    任务描述 本关任务:编写程序,多维度分析葡萄酒数据. 第1关 葡萄酒评论分析报告--国家列表和平均分 代码如下: import pandas as pd# 定义符号常量,用于索引,使之具有清晰的语义 ...

  3. 【radar】毫米波雷达相关数据集(检测、跟踪、里程计、SLAM、定位、场景识别)总结(1)

    毫米波雷达相关数据集(检测.跟踪.里程计.SLAM.定位.场景识别)总结(1) Radar相关产品和链接 TI AWR2243 Arbe Phoenix Continental ARS 540 Ocu ...

  4. 自动驾驶——车道线检测相关数据集整理

    自动驾驶视觉方向的分支车道线检测需要的相关数据集 暂时没有好好整理,先作个记录: 1.KITTI KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,主要于算法评测. KITTI数据 ...

  5. Red Wine Quality(红酒品质相关数据集)

    原文: Red Wine Quality The two datasets are related to red and white variants of the Portuguese " ...

  6. 【简单总结】SLAM 算法的 Benchmark 及相关数据集的结果对比

    前言与参考 主要是copy一下总结,方便自己后续找方案特定使用,所有的出处均在标题处和原链接跳转,此处仅做各个benchmark收集使用,如果有原作者觉得侵权,请联系我 将全力配合相关内容和链接删除 ...

  7. Yelp Dataset(Yelp业务-评论-用户数据集)

    原文: Yelp Dataset A trove of reviews, businesses, users, tips, and check-in data. This dataset is a s ...

  8. Goodreads-books(好书籍相关数据集)

    原文: Goodreads-books comprehensive list of all books listed in goodreads The primary reason for creat ...

  9. 农业动物相关数据集与算法——调研整理

    家禽疾病诊断 Machine Learning Dataset for Poultry Diseases Diagnostics 中小型家禽养殖者的家禽疾病诊断注释数据集由家禽粪便图像组成.这些家禽粪 ...

最新文章

  1. 关于压缩工具 7z(7-zip) 如何创建自释放档案(选项 -sfx 的解读)
  2. java ee 下载 安装配置_JavaEE下载安装及配置.doc
  3. 详解Python变量作用域
  4. AttributeError: module ‘cv2.cv2‘ has no attribute ‘bgsegm‘
  5. 29_2020年12月29日疫情一览
  6. 5个Web前端开发软件,零基础入门完全够用了!
  7. hashmap java 排序_Java 对HashMap进行排序的三种常见方法
  8. RRR-RR五边形平面并联机构分析:Kinematics of a five-bar RRR-RR mechanism
  9. 文本比较工具-文本去重复工具
  10. Tone-Mapped Image Quality Assessment
  11. 随处可用的坐姿小帮手,还能按摩热敷,荣泰P30按摩坐垫体验
  12. 成年人的世界,不过如此
  13. 服务器系统如何克隆,服务器如何克隆操作系统
  14. 微信小程序开发的基本用法
  15. 关于Tomcat在启动时的socket bind failed 730048 错误
  16. 计算机怎么通电启动,怎么让电脑一通电就立即开机?
  17. 人文思考与科研探索之管锥篇
  18. UltraISO 制作系统启动盘教程
  19. 使用jupyter notebook运行卷积神经网络出现的版本问题
  20. 分布式搜索引擎ElasticSearch(二)---ElasticSearch进阶使用教程

热门文章

  1. Eclipse中,代码没错,但有红叉叉
  2. 计算机文化教程实验基础知识,《计算机文化基础》课程实验教学大纲
  3. 用canvas画阴阳鱼
  4. 福利!!!Python爬取好看的妹子图!!!
  5. html与网页设计 实践课,HTML5网页设计课程混合式教学设计与实践
  6. 纯 CSS3 实现波浪效果
  7. Unity3D优化技巧系列八
  8. 是免疫学家也是新晋妈妈,奥康纳在新冠疫苗研制团队中的一天
  9. 转发和重定向的区别和使用
  10. Response重定向