# -*- coding: utf-8 -*-
'''
Created on 2018年1月24日
@author: Jason.F
@summary: 有监督回归学习-探索式数据分析(EDA,Exploratory Data Analysis),发现数据的异常和分布情况以及特征间的相互关系
'''
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np#导入波士顿房屋数据集
df=pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data',header=None,sep='\s+')
df.columns=['CRIM','ZM','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']
#散点图矩阵,可视化不同特征间的两两关系,发现特征间关系以及异常点
sns.set(style='whitegrid',context='notebook')
#sns.reset_orig()#重设matplotlib风格
cols=['LSTAT','INDUS','NOX','RM','MEDV']
sns.pairplot(df[cols],size=2.5)
plt.show()
#皮尔逊积矩相关系数pearson product-moment correlation coefficient,衡量两两特征间的线性依赖关系
#标准化各特征间的协方差
cm = np.corrcoef(df[cols].values.T)
sns.set(font_scale=1.5)
hm= sns.heatmap(cm,cbar=True,annot=True,square=True,fmt='.2f',annot_kws={'size':15},yticklabels=cols,xticklabels=cols)
plt.show()

结果:

【Python-ML】探索式数据分析EDA(Exploratory Data Analysis)相关推荐

  1. R探索新数据分析(Exploratory Data Analysis,EDA)

    R探索新数据分析(Exploratory Data Analysis,EDA) 目录 R探索新数据分析(Exploratory Data Analysis,EDA) str方法进行数据概览及类型查看

  2. 探索性数据分析(Exploratory Data Analysis,EDA)

    探索性数据分析(Exploratory Data Analysis,EDA)主要的工作是:对数据进行清洗,对数据进行描述(描述统计量,图表),查看数据的分布,比较数据之间的关系,培养对数据的直觉,对数 ...

  3. Python之探索式数据分析

    探究数据分析的目的是为了找到有助于清理/准备/转换数据的思路,这些数据最终将用于机器学习算法/模型的建立.我们将采取以下行动: import numpy as np import pandas as ...

  4. python进行探索性数据分析EDA(Exploratory Data Analysis)分析

    python进行探索性数据分析EDA(Exploratory Data Analysis)分析 show holy respect to python community, for there ded ...

  5. R语言explore包进行探索性数据分析实战(EDA、exploratory data analysis):基于iris数据集

    R语言explore包进行探索性数据分析实战(EDA.exploratory data analysis):基于iris数据集 目录

  6. IBM Machine Learning学习笔记(一)——Exploratory Data Analysis for Machine Learning

    数据的探索性分析 1. 读入数据 (1)csv文件读取 (2)json文件读取 (3)SQL数据库读取 (4)Not-only SQL (NoSQL)读取 (5)从网络中获取 2. 数据清洗 (1)缺 ...

  7. 【CookBook pandas】学习笔记第五章 Exploratory Data Analysis

    dive more into - 深入讨论 exploratory data analysis , the process of sifting through the data and trying ...

  8. 一维数组实验题:计算平均数、中位数和众数 在调查数据分析(Survey data analysis)中经常需要计算平均数、中位数和众数。用函数编程计算40个输入数据(是取值1—10之间的任意整数)的平

    一维数组实验题:计算平均数.中位数和众数 在调查数据分析(Survey data analysis)中经常需要计算平均数.中位数和众数.用函数编程计算40个输入数据(是取值1-10之间的任意整数)的平 ...

  9. 【ML】探索性数据分析 (EDA)

    简介 探索性数据分析 (EDA) 以了解我们数据集的信号和细微差别.这是一个循环过程,可以在我们开发过程的各个阶段(标记之前/之后.预处理等)完成,具体取决于问题的定义程度.例如,如果我们不确定如何标 ...

最新文章

  1. php7安装执行configure报错error: off_t undefined; check your library configuration
  2. Backbone的写类方式
  3. 欢迎使用CSDN-markdown编辑器1
  4. Qt开发MQTT(二) 之第三方QMQTT
  5. SVN 集中式版本管理工具
  6. 树莓派换源、vim更新:树莓派更换国内可用镜像源
  7. .NET Core CLI 的性能诊断工具介绍
  8. python微信推送消息_Python编程之微信推送模板消息功能示例
  9. wxWindows的事件表机制
  10. caffe中pad的作用
  11. gcov 使用注意事项
  12. 商品详情页代码html,商品详情页food.vue
  13. 获取百度云盘真实下载链接(告别云盘客户端,全速下载)
  14. c语言入门很难,C语言入门教程,C语言编程,从入门到精通,没你想的那么难
  15. EasyClick 易点云测
  16. 如何在线批量将JPG图片转Word文件
  17. 向上滚动的文字的淡入淡出效果
  18. 转载[UGUI]深入理解Canvas Scaler
  19. 留学目的地选择之内华达州
  20. 【c++】C语言之输入行数,输出实心菱形和空心菱形

热门文章

  1. 计算机小键盘顺序,为什么电脑、电话数字键盘排列顺序不同?
  2. python 底层实现_用Python从底层实现一个多层感知机
  3. 2019_BUAAOO_第一单元总结
  4. 【工具篇】接口测试神器 -- Postman 入门教程
  5. reduce 轻松将cookie转化为对象
  6. 6.1 C/S 架构介绍
  7. 细说Android 4.0 NDK编程pdf
  8. Java NIO:IO与NIO的区别
  9. 17.2?Replication Implementation 复制实施:
  10. 通过script标签实现跨域