红酒、白酒数据集分析——案例(1)
详见:red_white_wine_quality数据集分析
(一)数据集概览
有两个样本:
winequality-red.csv
:红葡萄酒样本 red-wine 数据集
winequality-white.csv
:白葡萄酒样本 white-wine 数据集
每个样本都有得分从1到10的质量评分,以及若干理化检验的结果
# | 理化性质 | 字段名称 |
---|---|---|
1 | 固定酸度 | fixed acidity |
2 | 挥发性酸度 | volatile acidity |
3 | 柠檬酸 | citric acid |
4 | 残糖 | residual sugar |
5 | 氯化物 | chlorides |
6 | 游离二氧化硫 | free sulfur dioxide |
7 | 总二氧化硫 | total sulfur dioxide |
8 | 密度 | density |
9 | PH值 | pH |
10 | 硫酸盐 | sulphates |
11 | 酒精度 | alcohol |
12 | 质量 | quality |
(二)问题提出
- 根据此数据集中的列的直方图,以下哪个特征变量显示为右偏态?固定酸度、总二氧化硫、pH 值、酒精度
- 根据质量对不同特征变量的散点图,以下哪个最有可能对质量产生积极的影响?_挥发性酸度、残糖、pH 值、酒精度
- 某种类型的葡萄酒(红葡萄酒或白葡萄酒)是否代表更高的品质?
- 哪个酸度水平的平均评分最高?
- 酒精含量高的酒是否评分较高?
- 口感较甜的酒是否评分较高?
(三)分析步骤
导入数据和库依赖
import
修改不规范的列名
rename
合并数据集
append
基本数据分析:列数、缺失值统计、重复行统计
duplicated
、唯一值数量unique
、平均值mean
等等保存修改后的数据集
to_csv
可视化探索
plot
:绘制柱状图plot.hist
、查看偏态skew
、子图plt.subplots
分组并绘图:
groupby
红酒、白酒数据集分析——案例(1)相关推荐
- 数据分析案例--红酒数据集分析
介绍: 这篇文章主分析了红酒的通用数据集,这个数据集一共有1600个样本,11个红酒的理化性质,以及红酒的品质(评分从0到10).这里主要用python进行分析,主要内容分为:单变量,双变量,和多变量 ...
- R语言logistic回归、判别分析(LDA)、多元自适应样条回归MARS分析案例:分析乳腺癌数据集明确细针穿刺肿瘤活检结果
R语言logistic回归.判别分析(LDA).多元自适应样条回归MARS分析案例:分析乳腺癌数据集明确细针穿刺肿瘤活检结果 目录
- 红酒数据集分析【详细版】
红酒数据集分析[详细版] 原文链接:阿里云天池 数据连接:链接:https://pan.baidu.com/s/1UpVkbgOEIjpc_GQTGHyqTQ 提取码:ztjs 介绍 这个notebo ...
- 五十三、爱彼迎数据集分析建模
爱彼迎数据集分析建模为本专栏的Python数据分析案例. 因为文件比较大,所以保存了百度云 链接:https://pan.baidu.com/s/1geUgsLejvpTKgBmcSMSIdQ 提取码 ...
- 矩池云 | Tony老师解读Kaggle Twitter情感分析案例
今天Tony老师给大家带来的案例是Kaggle上的Twitter的情感分析竞赛.在这个案例中,将使用预训练的模型BERT来完成对整个竞赛的数据分析. 导入需要的库 import numpy as np ...
- python 情感分析实例_基于Python的情感分析案例
**情感分析 **又称为倾向性分析和意见挖掘 它是对带有情感色彩的主观性文本进行分析.处理.归纳和推理的过程 其中情感分析还可以细分为情感极性 倾向 分析 情感程度分析 主客观分析等. 情感极性分析的 ...
- 【数据分析师-数据分析项目案例三】多因素房价预测分析案例
多因素房价预测分析案例 1 数据来源 2 数据加载和基本的ETL 2.1 模块导入和数据加载 2.2 数据清洗 3 数据可视化 3.1 地理可视化 3.2 关系矩阵和热力图 3.3 添加衍生字段 3. ...
- 数据可视化分析案例:探索BRFSS电话调查数据
原文链接:http://tecdat.cn/?p=9284 加载包 library(tidyr) library(knitr) opts_chunk$set(echo = TRUE, fig.alig ...
- kaggle心脏病监测分析案例(数据分析+数据可视化)适合入门新手
心脏病监测分析 数据来源:kaggle 数据获取方式: 关注公众号:YOLO的学习进阶日常 回复:心脏病 为什么想做这个分析案例? 心脏病已经成为人类健康的三大杀手之一,为找到心脏病的病因,特此参考了 ...
最新文章
- 使用变量对象引出作用域链
- postman test 脚本
- python游戏编程入门 免费-Python游戏编程入门2
- .net 文件服务器系统,File-service基于ASP.NET Core的可伸缩、通用的文件服务器
- maven的pom.xml中repositories的作用
- Ubuntu的网络设置
- DetachedCriteria和Criteria的使用方法
- 阿里神器Arthas 3.1.2版本发布,新特性解读
- QQ帐号注销功能灰度体验中:预计下周发布!
- mysql配置my.cnf文件,以及参数优化提升性能
- Windows加密视频播放器使用教程
- 方舟原始恐惧mod生物代码_方舟:生存进化新手攻略
- python如何设计系统界面教程_python图形化界面设计tkinter!python用户界面设计教程...
- SPSS——描述性统计分析——探索性分析
- win10 共享文件夹 nplayer查看共享文件
- 计算机音乐谱大全告白气球,周杰伦《告白气球》钢琴曲谱
- mybati-plus自定义sql异常Invalid bound statement (not found)封装的sql查询正常
- 2019电大计算机专业英语1答案,2019年最新国家开放大学电大《管理英语4》网络核心课形考网考作业附全答案...
- 计算机系统实验-缓冲区炸弹
- ITFriend创业败局(二):初创公司应该怎样分配股权