Python数据分析与机器学习9-Seaborn之多变量分析
文章目录
- 一. 多变量分析概述
- 二. 多变量分析实例
- 2.1 数据集概述
- 2.2 实例
- 参考:
一. 多变量分析概述
观测两个变量之间的分布关系最好用散点图
代码1:
import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt
import seaborn as snssns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))x = np.random.gamma(6, size=200)mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])sns.jointplot(x="x", y="y", data=df)plt.show()
测试记录1:
代码2:
import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt
import seaborn as snssns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))x = np.random.gamma(6, size=200)mean, cov = [0, 1], [(1, .5), (.5, 1)]
x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):sns.jointplot(x=x, y=y, kind="hex", color="k")plt.show()
测试记录2:
二. 多变量分析实例
2.1 数据集概述
我们这边使用鸢尾花数据集:
- 数据集包含150个样本(数据集的行)
- 数据集包含4个属性(数据集的列):Sepal Length,Sepal Width,Petal Length,Petal Width:‘feature_names’
- 利用numpy.ndarray存储这150x4的数据:‘data’
分类标签取自array[‘Setosa’,‘Versicolour’,‘Virginica’]:‘target_names’
Setosa,Versicolour,Virginica是数据集所包含的3中品种的鸢尾花
这3个分类标签(即150x1数据)用np.ndarray存储:‘target’
总之,这个数据存储了150x4的特征数据和150x1的分类标签,其中特征数据又放在‘data’里,分类标签放在‘target’里
2.2 实例
代码:
import matplotlib.pyplot as plt
import seaborn as snsiris = sns.load_dataset("iris")
sns.pairplot(iris)plt.show()print ("test")
测试记录:
鸢尾花数据集总共有4个变量,4*4=16,所以直接生成了16个图
如果是柱形代表自身与自身
参考:
- https://study.163.com/course/introduction.htm?courseId=1003590004#/courseDetail?tab=1
Python数据分析与机器学习9-Seaborn之多变量分析相关推荐
- 23神经网络 :唐宇迪《python数据分析与机器学习实战》学习笔记
唐宇迪<python数据分析与机器学习实战>学习笔记 23神经网络 1.初识神经网络 百度深度学习研究院的图,当数据规模较小时差异较小,但当数据规模较大时深度学习算法的效率明显增加,目前大 ...
- python数据分析和机器学习入门,我有一些书单来推荐
想要快速入门python数据分析与机器学习,书籍是一个很好的门路,可以帮助我们系统的快速入门! 下面是一些不错的书单,分享给大家,我也在拔草中,未来会把阅读笔记分享在我的公众号:python数据分析和 ...
- 基于python的数据建模与分析案例_基于案例详解Python数据分析与机器学习
课程概述: 使用数据领域最主流语言Python及其分析与建模库作为核心武器.对于机器学习经典算法给出完整的原理推导并基于实例进行讲解,基于案例演示如何应用机器学习算法解决实际问题. 课程特色: 通俗易 ...
- 跟着迪哥学python 经管之家_跟着迪哥学Python数据分析与机器学习实战
本书结合了机器学习.数据分析和Python语言,通过案例以通俗易懂的方式讲解了如何将算法应用到实际任务. 全书共20章,大致分为4个部分.第一部分介绍了Python的工具包,包括科学计算库Numpy. ...
- 01、python数据分析与机器学习实战——Python可视化库Seaborn
seaborn简介 Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图. seaborn基础 i ...
- Python数据分析与机器学习
Python基础知识和数据结构 基本的数据结构(Basic data structures) Name Nation Declaration e.g. Tuple 元组 tuple b = (1,2. ...
- python天气数据分析论文_《Python数据分析与机器学习实战-唐宇迪》读书笔记第9章--随机森林项目实战——气温预测(2/2)...
第9章--随机森林项目实战--气温预测(2/2) 第8章已经讲解过随机森林的基本原理,本章将从实战的角度出发,借助Python工具包完成气温预测任务,其中涉及多个模块,主要包含随机森林建模.特征选择. ...
- python数据分析与机器学习(Numpy,Pandas,Matplotlib)
机器学习怎么学? 机器学习包含数学原理推导和实际应用技巧,所以需要清楚算法的推导过程和如何应用. 深度学习是机器学习中神经网络算法的延伸,在计算机视觉和自然语言处理中应用更厉害一些. 自己从头开始做笔 ...
- 01、python数据分析与机器学习实战——python数据分析处理库-Pandas
pandas介绍 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. panda ...
最新文章
- 常用排序算法的C++实现
- Maven笔记(2)-- 常用命令和标准的Maven项目结构
- (NO.00003)iOS游戏简单的机器人投射游戏成形记(七)
- 科大星云诗社动态20210329
- Superhero Transformation
- css实现垂直居中的几种方式(布局常用)
- 移动端下拉刷新原理和实例
- 这几部高分学科纪录片,助力孩子涨姿势拓视野~
- 【PyTorch】中view()==>相当于numpy中resize()、reshape()的功能
- url、href、src
- php实战第二十五天
- Android 系统(4)---Android HAL层与Linux Kernel层驱动开发简介
- 2022下半年,系统架构师论文写作相关知识点
- Wonderware配置-Intouch读取数据 6
- php日历表代码,PHP输出日历表代码实例
- websockets_Websockets在数据工程中鲜为人知的模式
- 抖音大数据,教你爬爬爬!
- docker-compose up -d --build不会更新镜像;什么时候容器会变更
- 软件设计师刷题与知识点总结 笔记
- org.apache.flink.shaded.guava18.com.google.common.util.concurrent.ThreadFactoryBuilder 真实解决方案
热门文章
- 手机火狐浏览html文件在哪里,火狐手机浏览器书签在哪?
- hadoop3 Yarn容量(Capacity Scheduler)调度器和公平(Fair Scheduler)调度器配置
- 新氧《2021中国医美抗衰消费趋势报告》:医美抗衰市场规模超755亿元
- 汇编 跳转指令: JMP、JCXZ、JECXZ、JA、JE、JNA、JNE、JZ、JB、JS、JC、JNC、JG、JNBE、JO、JP、JL、JPO、JGE、JLE 汇编语言
- 诺贝尔奖大数据告诉你:最聪明的星座是谁
- 【简历制作合集】面试时到底是用彩打简历还是黑白简历更出彩呢?|智测优聘出品
- 图灵计算机模型意义,图灵机计算模型的主要贡献是什么
- elasticse报错 max virtual memory areas vm.max_map_count [65530] is too low, increase to at leas
- linux组权限管理,Linux组管理和权限管理
- 通信电子电路(二十) 第一章复习+习题讲解