• 首先读取数据
#读取红酒数据
target_url = "https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv"
df = pd.read_csv(target_url, sep = ";")#打印数据形状和数据类型的个数
print (df.shape)
print (df.get_dtype_counts())

数据释义:每一行代表一组数据,1-11列代表红酒不同属性的检测值,最后一列代表红酒质量指数,下面通过将质量指数映射到(0,1)区间,根据优劣程度对应到所画折线图的不同颜色(cm.RdYlBu函数:值越小越劣对应线条越红,反之越蓝),进而分析判断好酒劣酒在哪些质量指数数据上有差异。

  • 判断鉴定红酒优劣的指标
##根据红酒质量的不同画不同颜色的折线
#1,将数据值标准化
_df = (df*1.0-df.mean())/df.std()
#2,将红酒质量指数映射到(0,1)范围内
q = df.shape[1]-1
dq = df.iloc[:,q]*1.0
_dq = (dq-dq.mean())/dq.std()
_dq = 1.0/(1.0+math.e**(-_dq))
#3,画图:偏蓝色代表质量较好的红酒;偏红色线表质量较差的红酒
plt.figure(figsize = (10,5))
for i in range(df.shape[0]):_df.iloc[i,1:q].plot(color=plt.cm.RdYlBu(_dq[i]), alpha = 0.5)
plt.xlabel(df.columns.tolist()[0:q])
plt.show()


通过观察结果图发现:较好的红酒酒精含量相对较高,密度相对较低,非挥发性酸含量相对较低。

  • 分析各个属性间的关系
    最后通过画热度相关图,分析各个属性间的关系:
#热度相关图,黄色对应强相关。
plt.pcolor(df.corr())
plt.show()


在上图的展示中,以第1个属性为例,通过热度图可以发现它和第3个、第8个属性(绿色方块)有着较强的相关性,即非挥发性酸值大的话,糖分残留和ph值就会大,这和我们的化学常识相一致,同时这也变相说明上一部分的推理挥发性酸值越大–>糖分残留值越大(口感越甜)的红酒相对较为劣质,这和我们的常识也是相一致的。

零基础python机器学习笔记--代码实战第二天数据分析相关推荐

  1. 零基础Python修炼笔记——整理自官方文档

    零基础Python修炼笔记 题外话 "编外人员"学Python 书籍 交互课程 中小学儿童学习 教材和网站 科学工作者教程 视频 工具 后记 题外话 去年我自学Python的时候, ...

  2. 从零编写60%+胜率的短线择时信号!零基础python量化投资代码详解【邢不行】

    引言: 邢不行的系列帖子"量化小讲堂",通过实际案例教初学者使用python进行量化投资,了解行业研究方向,希望能对大家有帮助. ​ ​ 如果有人说你是百年难得一见的量化投资天才, ...

  3. 零基础python必背代码-零基础入门学习python 96集全

    零基础入门学习python 96集全 第000讲 愉快的开始(视频+课件)xa0 第001讲 我和Python第一次亲密接触(视频+课件)xa0 第002讲 用Python设第一个游戏(视频+课件+源 ...

  4. 零基础python必背代码-编程零基础应当如何开始学习 Python?

    学Python,最高效的方法其实就是自学+自问+实战(海伦泰勒学习法的精简版). 本文分为3大板块,不仅要帮你0基础入门,还专门写了进阶内容. 进阶内容中这51个Python的秘密,你可不一定知道. ...

  5. 零基础python必背代码-零基础小白Python入门必看:通俗易懂,搞定深浅拷贝

    Python中的深浅拷贝 在讲深浅拷贝之前,想先讲一下 is 和==的区别. 在进行对象是否相等比较的时候我们可以用is 和 == is:比较两个对象的引用是否相同,即它们的id 是否一样 == : ...

  6. 零基础python必背代码-30个Python常用极简代码,拿走就用

    学 Python 怎样才最快,当然是实战各种小项目,只有自己去想与写,才记得住规则.本文是 30 个极简任务,初学者可以尝试着自己实现:本文同样也是 30 段代码,Python 开发者也可以看看是不是 ...

  7. 【百度领航团】小白零基础python学习笔记

    计算机是什么 在现实生活中,越来越无法离开计算机了电脑.笔记本.手机.游戏机.汽车导航.智能电视 ... 计算机就是一个用来计算的机器! 目前来讲,计算机只能根据人类的指令来完成各种操作,人让它干嘛他 ...

  8. 零基础Python爬虫教程和实战(一)

    今天我们来学爬虫,这个系列预计会出11期 爬虫原理: ------------------什么是爬虫?----------------- 请求网站并提取数据的自动化程序 --------------- ...

  9. python行业中性_【建投金工丁鲁明团队 经典回顾】:零基础python代码策略模型实战...

    原标题:[建投金工丁鲁明团队 经典回顾]:零基础python代码策略模型实战 编者按 本文<零基础python代码策略模型实战>,属于大数据选股领域,报告发布时间为2018年3月8日. 内 ...

最新文章

  1. 使用命令wsimport构建WebService客户端
  2. VScode新建自定义模板快捷方式
  3. Linux mount: Structure needs cleaning 错误解决方法
  4. xshell堡垒机_Jumpserver开源堡垒机管理
  5. 我的世界python俄罗斯方块手机版下载_欢乐俄罗斯方块
  6. 教你 Shiro + SpringBoot 整合 JWT
  7. linux lnmp1.5.tar.gz,Linux 下lnmp
  8. MVC Json方法里的一个坑
  9. Java定义一维数组从键盘赋值
  10. C语言软盘,如何使用编程的方法--创建1.44兆软盘镜像的几种方法。。。(之一 C语言法)...
  11. Linux:telnet命令安装
  12. IT计算机实习:JAVA实习报告范文(二)
  13. 几款强大的数据恢复工具你有用过吗
  14. C语言客房管理系统课程设计
  15. 笔记本怎么自己装系统?u盘装系统windows7教程图解
  16. linux常用命令、linux系统、linux属于什么操作系统、linux系统安装、linux怎么读、linux和windows的区别、linux配置ip地址、linux系统一般用来,在线查询工具
  17. OKLink行业观察:投资数字资产的机构版图(三)——Stone Ridge和纽约数字投资集团
  18. abb机器人指令手册_ABB机器人速度设置
  19. 迅雷插件导致js获取后端返回结果报错问题
  20. IntelliJ IDEA 快捷键及模板Templates设置

热门文章

  1. ue4蓝图和ai的区别_UE4 AI教程
  2. UL grant的分配(LCP)
  3. 网络安全观察国外政策法规大事件
  4. 使用hive做单词统计
  5. 统计cassandra单表数据量
  6. CMU 15-445 数据库课程第五课文字版 - 缓冲池
  7. tushare的使用
  8. php5.6 nts ts,php ts nts v6 v9的区别
  9. GMTC-闲鱼Flutter实践效果访谈
  10. 构建乘积数组[前后缀优化]