【Python-ML】探索式数据分析EDA(Exploratory Data Analysis)
# -*- coding: utf-8 -*-
'''
Created on 2018年1月24日
@author: Jason.F
@summary: 有监督回归学习-探索式数据分析(EDA,Exploratory Data Analysis),发现数据的异常和分布情况以及特征间的相互关系
'''
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np#导入波士顿房屋数据集
df=pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data',header=None,sep='\s+')
df.columns=['CRIM','ZM','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT','MEDV']
#散点图矩阵,可视化不同特征间的两两关系,发现特征间关系以及异常点
sns.set(style='whitegrid',context='notebook')
#sns.reset_orig()#重设matplotlib风格
cols=['LSTAT','INDUS','NOX','RM','MEDV']
sns.pairplot(df[cols],size=2.5)
plt.show()
#皮尔逊积矩相关系数pearson product-moment correlation coefficient,衡量两两特征间的线性依赖关系
#标准化各特征间的协方差
cm = np.corrcoef(df[cols].values.T)
sns.set(font_scale=1.5)
hm= sns.heatmap(cm,cbar=True,annot=True,square=True,fmt='.2f',annot_kws={'size':15},yticklabels=cols,xticklabels=cols)
plt.show()
结果:
【Python-ML】探索式数据分析EDA(Exploratory Data Analysis)相关推荐
- R探索新数据分析(Exploratory Data Analysis,EDA)
R探索新数据分析(Exploratory Data Analysis,EDA) 目录 R探索新数据分析(Exploratory Data Analysis,EDA) str方法进行数据概览及类型查看
- 探索性数据分析(Exploratory Data Analysis,EDA)
探索性数据分析(Exploratory Data Analysis,EDA)主要的工作是:对数据进行清洗,对数据进行描述(描述统计量,图表),查看数据的分布,比较数据之间的关系,培养对数据的直觉,对数 ...
- Python之探索式数据分析
探究数据分析的目的是为了找到有助于清理/准备/转换数据的思路,这些数据最终将用于机器学习算法/模型的建立.我们将采取以下行动: import numpy as np import pandas as ...
- python进行探索性数据分析EDA(Exploratory Data Analysis)分析
python进行探索性数据分析EDA(Exploratory Data Analysis)分析 show holy respect to python community, for there ded ...
- R语言explore包进行探索性数据分析实战(EDA、exploratory data analysis):基于iris数据集
R语言explore包进行探索性数据分析实战(EDA.exploratory data analysis):基于iris数据集 目录
- IBM Machine Learning学习笔记(一)——Exploratory Data Analysis for Machine Learning
数据的探索性分析 1. 读入数据 (1)csv文件读取 (2)json文件读取 (3)SQL数据库读取 (4)Not-only SQL (NoSQL)读取 (5)从网络中获取 2. 数据清洗 (1)缺 ...
- 【CookBook pandas】学习笔记第五章 Exploratory Data Analysis
dive more into - 深入讨论 exploratory data analysis , the process of sifting through the data and trying ...
- 一维数组实验题:计算平均数、中位数和众数 在调查数据分析(Survey data analysis)中经常需要计算平均数、中位数和众数。用函数编程计算40个输入数据(是取值1—10之间的任意整数)的平
一维数组实验题:计算平均数.中位数和众数 在调查数据分析(Survey data analysis)中经常需要计算平均数.中位数和众数.用函数编程计算40个输入数据(是取值1-10之间的任意整数)的平 ...
- 【ML】探索性数据分析 (EDA)
简介 探索性数据分析 (EDA) 以了解我们数据集的信号和细微差别.这是一个循环过程,可以在我们开发过程的各个阶段(标记之前/之后.预处理等)完成,具体取决于问题的定义程度.例如,如果我们不确定如何标 ...
最新文章
- php7安装执行configure报错error: off_t undefined; check your library configuration
- Backbone的写类方式
- 欢迎使用CSDN-markdown编辑器1
- Qt开发MQTT(二) 之第三方QMQTT
- SVN 集中式版本管理工具
- 树莓派换源、vim更新:树莓派更换国内可用镜像源
- .NET Core CLI 的性能诊断工具介绍
- python微信推送消息_Python编程之微信推送模板消息功能示例
- wxWindows的事件表机制
- caffe中pad的作用
- gcov 使用注意事项
- 商品详情页代码html,商品详情页food.vue
- 获取百度云盘真实下载链接(告别云盘客户端,全速下载)
- c语言入门很难,C语言入门教程,C语言编程,从入门到精通,没你想的那么难
- EasyClick 易点云测
- 如何在线批量将JPG图片转Word文件
- 向上滚动的文字的淡入淡出效果
- 转载[UGUI]深入理解Canvas Scaler
- 留学目的地选择之内华达州
- 【c++】C语言之输入行数,输出实心菱形和空心菱形
热门文章
- 计算机小键盘顺序,为什么电脑、电话数字键盘排列顺序不同?
- python 底层实现_用Python从底层实现一个多层感知机
- 2019_BUAAOO_第一单元总结
- 【工具篇】接口测试神器 -- Postman 入门教程
- reduce 轻松将cookie转化为对象
- 6.1 C/S 架构介绍
- 细说Android 4.0 NDK编程pdf
- Java NIO:IO与NIO的区别
- 17.2?Replication Implementation 复制实施:
- 通过script标签实现跨域