UCL葡萄酒(red white wine quality)数据集字段解释、数据导入实战

目录

UCL葡萄酒(red white wine quality)数据集字段解释、数据导入实战

#数据字段说明

#导入数据


#数据字段说明

葡萄酒分为白葡萄酒和红葡萄酒两类。

此处为白葡萄酒:增加一个类型字段则为包含白葡萄和红葡萄的葡萄酒数据集

两个数据集在单独拆分的时候quality的类别可能有轻微差异。

固定酸度:大多数与葡萄酒有关的酸或固定的或不挥发的(不易蒸发)
挥发性酸味:葡萄酒中醋酸的含量过高,会产生令人不快的醋味
柠檬酸:少量的柠檬酸可以增加葡萄酒的新鲜度和风味
残糖:发酵结束后的残糖量,每升1克以下的酒很少,45克以上的酒被认为是甜的
氯化物:酒中盐的含量
游离二氧化硫:SO2以游离形式存在于SO2分子(作为溶解气体)与亚硫酸氢盐离子之间的平衡状态;它可以防止葡萄酒中的微生物生长和氧化
总二氧化硫:SO2游离态和结合态的量;在低浓度的情况下,SO2在葡萄酒中几乎检测不到,但当游离SO2浓度超过50ppm时,SO2在葡萄酒的嗅觉和味觉中就会变得明显
密度:根据酒精和糖含量的百分比,水的密度接近于水的密度
pH值:描述葡萄酒的酸性或碱性程度,从0(非常酸)到14(非常碱性);大多数葡萄酒的pH值在3-4之间
硫酸盐:一种葡萄酒添加剂,可以提高二氧化硫气体(SO2)水平,起到抗菌和抗氧化剂的作用
酒精:葡萄酒中酒精含量的百分比
质量:输出变量(根据感官数据,评分0 - 10),有专门的评酒师和调酒师的职业

White Wine Quality dataset which is a tidy data set. This data set contains 4,898 white wines with 11 variables on quantifying the chemical properties of each wine. At least 3 wine experts rated the quality of each wine, providing a rating between 0 (very bad) and 10 (very excellent).


**fixed acidity** : most acids involved with wine or fixed or nonvolatile (do not evaporate readily)

**volatile acidity_** : the amount of acetic acid in wine, which at too high of levels can lead to an unpleasant, vinegar taste

**citric acid** : found in small quantities, citric acid can add ‘freshness’ and flavor to wines

**residual sugar** : the amount of sugar remaining after fermentation stops, it’s rare to find wines with less than 1 gram/liter and wines with greater than 45 grams/liter are considered sweet

**chlorides** : the amount of salt in the wine

**free sulfur dioxide** : the free form of SO2 exists in equilibrium between molecular SO2 (as a dissolved gas) and bisul-fite ion; it prevents microbial growth and the oxidation of wine

**total sulfur dioxide**: amount of free and bound forms of S02; in low concentrations, SO2 is mostly undetectable in wine, but at free SO2 concentrations over 50 ppm, SO2 becomes evident in the nose and taste of wine

**density** : the density of water is close to that of water depending on the percent alcohol and sugar con-tent

**pH** : describes how acidic or basic a wine is on a scale from 0 (very acidic) to 14 (very basic); most wines are between 3–4 on the pH scale

**sulphates** : a wine additive which can contribute to sulfur dioxide gas (S02) levels, which acts as an antimicrobial and antioxidant

**alcohol** : the percent alcohol content of the wine

**quality** : output variable (based on sensory data, score between 0 and 10)


葡萄酒认证包括物理化学测试,例如密度,pH,酒精含量,固定和挥发性酸度的测定等。

可以在UCI机器学习存储库中找到该数据集。 葡萄酒分为白葡萄酒和红葡萄酒两类。 
该分析涉及白葡萄酒,并基于数据集中显示的13个变量/特征:
固定酸度
挥发性酸度
柠檬酸
残留糖
氯化物
游离二氧化硫
总二氧化硫
密度
pH值
硫酸盐
酒精
质量

#导入数据

df = pd.read_csv('winequality-white.csv', sep=';')
df.head()
df.tail()
# df.sample(5)


UCL白葡萄酒和红葡萄酒合起来的数据集,增加一个类型字段指示是白葡萄酒还是红葡萄酒

## 'data.frame':    3000 obs. of  15 variables:
##  $ X                   : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ fixed.acidity       : num  7.4 7.8 7.8 11.2 7.4 7.4 7.9 7.3 7.8 7.5 ...
##  $ volatile.acidity    : num  0.7 0.88 0.76 0.28 0.7 0.66 0.6 0.65 0.58 0.5 ...
##  $ citric.acid         : num  0 0 0.04 0.56 0 0 0.06 0 0.02 0.36 ...
##  $ residual.sugar      : num  1.9 2.6 2.3 1.9 1.9 1.8 1.6 1.2 2 6.1 ...
##  $ chlorides           : num  0.076 0.098 0.092 0.075 0.076 0.075 0.069 0.065 0.073 0.071 ...
##  $ free.sulfur.dioxide : num  11 25 15 17 11 13 15 15 9 17 ...
##  $ total.sulfur.dioxide: num  34 67 54 60 34 40 59 21 18 102 ...
##  $ density             : num  0.998 0.997 0.997 0.998 0.998 ...
##  $ pH                  : num  3.51 3.2 3.26 3.16 3.51 3.51 3.3 3.39 3.36 3.35 ...
##  $ sulphates           : num  0.56 0.68 0.65 0.58 0.56 0.56 0.46 0.47 0.57 0.8 ...
##  $ alcohol             : num  9.4 9.8 9.8 9.8 9.4 9.4 9.4 10 9.5 10.5 ...
##  $ quality             : int  5 5 5 6 5 5 5 7 7 5 ...
##  $ type                : Factor w/ 2 levels "Red","White": 1 1 1 1 1 1 1 1 1 1 ...
##  $ quality.bucket      : Factor w/ 3 levels "Low","Medium",..: 2 2 2 2 2 2 2 3 3 2 ...

参考:kaggle+Predicting White Wine Quality

参考:UCL

参考:泰坦尼克号数据集_Kaggle | 泰坦尼克号幸存分析(字段介绍)

参考:Red and White Wine Quality

UCL葡萄酒(red white wine quality)数据集字段解释、数据导入实战相关推荐

  1. Dataset:White Wine Quality白葡萄酒品质数据集的简介、下载、使用方法之详细攻略

    Dataset:White Wine Quality白葡萄酒品质数据集的简介.下载.使用方法之详细攻略 目录 White Wine Quality白葡萄酒品质数据集的简介 1.输入变量(基于物理化学测 ...

  2. R语言数据包自带数据集之ISwR包的melanom数据集字段解释、数据导入实战

    R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数 ...

  3. R语言数据包自带数据集之survival包的colon数据集字段解释、数据导入实战

    R语言数据包自带数据集之survival包的colon数据集字段解释.数据导入实战 #数据字段说明 colon数据集:B/C期结肠癌辅助化疗治疗数据 d # 患者编号 study # 所有患者都是1 ...

  4. R语言数据包自带数据集之survival包的lung数据集字段解释、数据导入实战

    R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导 ...

  5. R语言数据包自带数据集之ToothGrowth数据集字段解释、数据导入实战

    R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数据 #数 ...

  6. 泰坦尼克号(titanic)数据集字段解释、数据导入实战

    泰坦尼克号(titanic)数据集字段解释.数据导入实战 目录 泰坦尼克号(titanic)数据集字段解释.数据导入实战 #数据字段说明 #导入数据 #数据字段说明 # 尽管在沉船事件中幸存下有'一些 ...

  7. R语言数据包自带数据集之mtcars数据集字段解释、数据导入实战

    R语言数据包自带数据集之mtcars数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之mtcars数据集字段解释.数据导入实战 #会用帮助?或者help函数 #字段说明 #导入包 #导入数据 ...

  8. Python----数据分析-使用scikit-learn构建模型实训(wine数据集、wine_quality数据)

    Python----数据分析-使用scikit-learn构建模型实训(wine数据集.wine_quality数据) 目录: 实训1 使用 sklearn处理wine和wine_quality数据集 ...

  9. Red Wine Quality(红酒品质相关数据集)

    原文: Red Wine Quality The two datasets are related to red and white variants of the Portuguese " ...

最新文章

  1. 打架斗殴烫头酗酒抽烟的小混混,逆袭保送中国科学院,后来怎么样了?
  2. springboot自动装配原理笔记一
  3. [转载] 数据库分析手记 —— InnoDB锁机制分析
  4. Qt中的QSpinBox
  5. 如何禁用 ASP.NET 网站的所有的 浏览器缓存 ?
  6. selector多路复用_python selectors模块实现 IO多路复用机制的上传下载
  7. Lua中实现类似C#的事件机制
  8. SQL 连接 JOIN 例解。(左连接,右连接,全连接,内连接,交叉连接,自连接)...
  9. 20个经典模拟电路(详细图文)
  10. SSRS 2012 高级图表类型 -- 圆饼图
  11. FPGA综合项目——SDRAM控制器
  12. 开发uni-app时HBuilderX编辑器使用微信小程序模拟器保存代码无法刷新模拟器问题
  13. XCode 报错Thread 2:signal SIGABRT
  14. .netcore基础知识(一)
  15. anaconda安装dlib出现ImportError: libopenblas.so.0: cannot open shared object file***
  16. 补码原理——负数为什么要用补码表示
  17. 热加工作业考研题目答案分享——Joining processes 4
  18. Win10如何运行经典200M游戏CS反恐精英(附安装包)
  19. 军职在线高性能计算机网络答案,全国计算机一级考试题库(附答案).pdf
  20. 2020年移动发展趋势

热门文章

  1. 秋招要跪?不怕!领走这份机器学习求职攻略
  2. 绩效面谈的细节,阿里巴巴是如何做的?
  3. 7个值得推荐的优质软件,让人忍不住体验!
  4. “三板斧”式文化价值体系互助协作,打通企业全流程管理模式
  5. 解读《这就是 OKR》 | 你制定的 OKR 真的合格吗?
  6. 开发一个微信小程序贵不贵,需要花费多少钱?
  7. 最小树形图复杂度分析
  8. linux shell 读取文件 笔记
  9. python3安装常见问题_Python3下安装spyder及常见问题解决
  10. 如何通过域服务器推送安装文件,域环境推送exe程序并自动安装教程域环境推送exe程序并自动安装教程.pdf...