Wine Reviews(葡萄酒评论相关数据集)
原文:
Wine Reviews
130k wine reviews with variety, location, winery, price, and description
After watching Somm (a documentary on master sommeliers) I wondered how I could create a predictive model to identify wines through blind tasting like a master sommelier would. The first step in this journey was gathering some data to train a model. I plan to use deep learning to predict the wine variety using words in the description/review. The model still won't be able to taste the wine, but theoretically it could identify the wine based on a description that a sommelier could give. If anyone has any ideas on how to accomplish this, please post them!
This dataset contains three files:
winemag-data-130k-v2.csv contains 10 columns and 130k rows of wine reviews.
winemag-data_first150k.csv contains 10 columns and 150k rows of wine reviews.
winemag-data-130k-v2.json contains 6919 nodes of wine reviews.
Click on the data tab to see individual file descriptions, column-level metadata and summary statistics.
译:
葡萄酒评论
130k葡萄酒评论,包括品种、位置、酒庄、价格和描述
在看了Somm(一部关于大师侍酒师的纪录片)之后,我想知道如何创建一个预测模型,通过盲品来识别葡萄酒,就像一个大师级的侍酒师一样。这个旅程的第一步是收集一些数据来训练模型。我计划用深入的学习来预测葡萄酒的品种,在描述/评论中使用单词。该模型仍然无法品尝葡萄酒,但理论上它可以根据品酒师的描述来识别葡萄酒。如果有人对如何做到这一点有任何想法,请发表他们!
此数据集包含三个文件:
winemag-data-130k-v2.csv包含10列和130k行葡萄酒评论。
winemag-data_first150k.csv包含10列和15万行葡萄酒评论。
winemag-data-130k-v2.json包含6919个葡萄酒评论节点。
单击“数据”选项卡以查看单个文件说明、列级元数据和摘要统计信息。
大家可以到官网地址下载数据集,我自己也在百度网盘分享了一份。可关注本人公众号,回复“2020101703”获取下载链接。
Wine Reviews(葡萄酒评论相关数据集)相关推荐
- 【深度学习】机器学习\深度学习常见相关公开数据集汇总(图像处理相关数据集、自然语言处理相关数据集、语音处理相关数据集)
一.前言 1. 介绍 常来说,深度学习的关键在于实践.从图像处理到语音识别,每一个细分领域都有着独特的细微差别和解决方法. 然而,你可以从哪里获得这些数据呢?现在大家所看到的大部分研究论文都用的是专有 ...
- 6.1 葡萄酒评论分析报告
任务描述 本关任务:编写程序,多维度分析葡萄酒数据. 第1关 葡萄酒评论分析报告--国家列表和平均分 代码如下: import pandas as pd# 定义符号常量,用于索引,使之具有清晰的语义 ...
- 【radar】毫米波雷达相关数据集(检测、跟踪、里程计、SLAM、定位、场景识别)总结(1)
毫米波雷达相关数据集(检测.跟踪.里程计.SLAM.定位.场景识别)总结(1) Radar相关产品和链接 TI AWR2243 Arbe Phoenix Continental ARS 540 Ocu ...
- 自动驾驶——车道线检测相关数据集整理
自动驾驶视觉方向的分支车道线检测需要的相关数据集 暂时没有好好整理,先作个记录: 1.KITTI KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,主要于算法评测. KITTI数据 ...
- Red Wine Quality(红酒品质相关数据集)
原文: Red Wine Quality The two datasets are related to red and white variants of the Portuguese " ...
- 【简单总结】SLAM 算法的 Benchmark 及相关数据集的结果对比
前言与参考 主要是copy一下总结,方便自己后续找方案特定使用,所有的出处均在标题处和原链接跳转,此处仅做各个benchmark收集使用,如果有原作者觉得侵权,请联系我 将全力配合相关内容和链接删除 ...
- Yelp Dataset(Yelp业务-评论-用户数据集)
原文: Yelp Dataset A trove of reviews, businesses, users, tips, and check-in data. This dataset is a s ...
- Goodreads-books(好书籍相关数据集)
原文: Goodreads-books comprehensive list of all books listed in goodreads The primary reason for creat ...
- 农业动物相关数据集与算法——调研整理
家禽疾病诊断 Machine Learning Dataset for Poultry Diseases Diagnostics 中小型家禽养殖者的家禽疾病诊断注释数据集由家禽粪便图像组成.这些家禽粪 ...
最新文章
- 关于压缩工具 7z(7-zip) 如何创建自释放档案(选项 -sfx 的解读)
- java ee 下载 安装配置_JavaEE下载安装及配置.doc
- 详解Python变量作用域
- AttributeError: module ‘cv2.cv2‘ has no attribute ‘bgsegm‘
- 29_2020年12月29日疫情一览
- 5个Web前端开发软件,零基础入门完全够用了!
- hashmap java 排序_Java 对HashMap进行排序的三种常见方法
- RRR-RR五边形平面并联机构分析:Kinematics of a five-bar RRR-RR mechanism
- 文本比较工具-文本去重复工具
- Tone-Mapped Image Quality Assessment
- 随处可用的坐姿小帮手,还能按摩热敷,荣泰P30按摩坐垫体验
- 成年人的世界,不过如此
- 服务器系统如何克隆,服务器如何克隆操作系统
- 微信小程序开发的基本用法
- 关于Tomcat在启动时的socket bind failed 730048 错误
- 计算机怎么通电启动,怎么让电脑一通电就立即开机?
- 人文思考与科研探索之管锥篇
- UltraISO 制作系统启动盘教程
- 使用jupyter notebook运行卷积神经网络出现的版本问题
- 分布式搜索引擎ElasticSearch(二)---ElasticSearch进阶使用教程