一. 多变量分析概述

观测两个变量之间的分布关系最好用散点图

代码1:

import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt
import seaborn as snssns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))x = np.random.gamma(6, size=200)mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])sns.jointplot(x="x", y="y", data=df)plt.show()

测试记录1:

代码2:

import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt
import seaborn as snssns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))x = np.random.gamma(6, size=200)mean, cov = [0, 1], [(1, .5), (.5, 1)]
x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):sns.jointplot(x=x, y=y, kind="hex", color="k")plt.show()

测试记录2:

二. 多变量分析实例

2.1 数据集概述

我们这边使用鸢尾花数据集:

数据集包含150个样本（数据集的行）
数据集包含4个属性（数据集的列）：Sepal Length，Sepal Width，Petal Length，Petal Width：‘feature_names’
利用numpy.ndarray存储这150x4的数据：‘data’
分类标签取自array[‘Setosa’，‘Versicolour’，‘Virginica’]：‘target_names’
Setosa，Versicolour，Virginica是数据集所包含的3中品种的鸢尾花
这3个分类标签（即150x1数据）用np.ndarray存储：‘target’

总之，这个数据存储了150x4的特征数据和150x1的分类标签，其中特征数据又放在‘data’里，分类标签放在‘target’里

2.2 实例

代码:

import matplotlib.pyplot as plt
import seaborn as snsiris = sns.load_dataset("iris")
sns.pairplot(iris)plt.show()print ("test")

测试记录:
鸢尾花数据集总共有4个变量，4*4=16，所以直接生成了16个图
如果是柱形代表自身与自身

参考：

https://study.163.com/course/introduction.htm?courseId=1003590004#/courseDetail?tab=1

Python数据分析与机器学习9-Seaborn之多变量分析相关推荐

23神经网络 :唐宇迪《python数据分析与机器学习实战》学习笔记
唐宇迪<python数据分析与机器学习实战>学习笔记 23神经网络 1.初识神经网络百度深度学习研究院的图,当数据规模较小时差异较小,但当数据规模较大时深度学习算法的效率明显增加,目前大 ...
python数据分析和机器学习入门，我有一些书单来推荐
想要快速入门python数据分析与机器学习,书籍是一个很好的门路,可以帮助我们系统的快速入门! 下面是一些不错的书单,分享给大家,我也在拔草中,未来会把阅读笔记分享在我的公众号:python数据分析和 ...
基于python的数据建模与分析案例_基于案例详解Python数据分析与机器学习
课程概述: 使用数据领域最主流语言Python及其分析与建模库作为核心武器.对于机器学习经典算法给出完整的原理推导并基于实例进行讲解,基于案例演示如何应用机器学习算法解决实际问题. 课程特色: 通俗易 ...
跟着迪哥学python 经管之家_跟着迪哥学Python数据分析与机器学习实战
本书结合了机器学习.数据分析和Python语言,通过案例以通俗易懂的方式讲解了如何将算法应用到实际任务. 全书共20章,大致分为4个部分.第一部分介绍了Python的工具包,包括科学计算库Numpy. ...
01、python数据分析与机器学习实战——Python可视化库Seaborn
seaborn简介 Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图. seaborn基础 i ...
Python数据分析与机器学习
Python基础知识和数据结构基本的数据结构(Basic data structures) Name Nation Declaration e.g. Tuple 元组 tuple b = (1,2. ...
python天气数据分析论文_《Python数据分析与机器学习实战-唐宇迪》读书笔记第9章--随机森林项目实战——气温预测(2/2)...
第9章--随机森林项目实战--气温预测(2/2) 第8章已经讲解过随机森林的基本原理,本章将从实战的角度出发,借助Python工具包完成气温预测任务,其中涉及多个模块,主要包含随机森林建模.特征选择. ...
python数据分析与机器学习(Numpy,Pandas,Matplotlib)
机器学习怎么学? 机器学习包含数学原理推导和实际应用技巧,所以需要清楚算法的推导过程和如何应用. 深度学习是机器学习中神经网络算法的延伸,在计算机视觉和自然语言处理中应用更厉害一些. 自己从头开始做笔 ...
01、python数据分析与机器学习实战——python数据分析处理库-Pandas
pandas介绍 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. panda ...

Python数据分析与机器学习9-Seaborn之多变量分析

文章目录

一. 多变量分析概述

二. 多变量分析实例

2.1 数据集概述

2.2 实例

参考：

Python数据分析与机器学习9-Seaborn之多变量分析相关推荐

最新文章

热门文章