文章目录

  • 一. 多变量分析概述
  • 二. 多变量分析实例
    • 2.1 数据集概述
    • 2.2 实例
  • 参考:

一. 多变量分析概述

观测两个变量之间的分布关系最好用散点图

代码1:

import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt
import seaborn as snssns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))x = np.random.gamma(6, size=200)mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])sns.jointplot(x="x", y="y", data=df)plt.show()

测试记录1:

代码2:

import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt
import seaborn as snssns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))x = np.random.gamma(6, size=200)mean, cov = [0, 1], [(1, .5), (.5, 1)]
x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):sns.jointplot(x=x, y=y, kind="hex", color="k")plt.show()

测试记录2:

二. 多变量分析实例

2.1 数据集概述

我们这边使用鸢尾花数据集:

  1. 数据集包含150个样本(数据集的行)
  2. 数据集包含4个属性(数据集的列):Sepal Length,Sepal Width,Petal Length,Petal Width:‘feature_names’
  3. 利用numpy.ndarray存储这150x4的数据:‘data’
    分类标签取自array[‘Setosa’,‘Versicolour’,‘Virginica’]:‘target_names’
    Setosa,Versicolour,Virginica是数据集所包含的3中品种的鸢尾花
    这3个分类标签(即150x1数据)用np.ndarray存储:‘target’

总之,这个数据存储了150x4的特征数据和150x1的分类标签,其中特征数据又放在‘data’里,分类标签放在‘target’里

2.2 实例

代码:

import matplotlib.pyplot as plt
import seaborn as snsiris = sns.load_dataset("iris")
sns.pairplot(iris)plt.show()print ("test")

测试记录:
鸢尾花数据集总共有4个变量,4*4=16,所以直接生成了16个图
如果是柱形代表自身与自身

参考:

  1. https://study.163.com/course/introduction.htm?courseId=1003590004#/courseDetail?tab=1

Python数据分析与机器学习9-Seaborn之多变量分析相关推荐

  1. 23神经网络 :唐宇迪《python数据分析与机器学习实战》学习笔记

    唐宇迪<python数据分析与机器学习实战>学习笔记 23神经网络 1.初识神经网络 百度深度学习研究院的图,当数据规模较小时差异较小,但当数据规模较大时深度学习算法的效率明显增加,目前大 ...

  2. python数据分析和机器学习入门,我有一些书单来推荐

    想要快速入门python数据分析与机器学习,书籍是一个很好的门路,可以帮助我们系统的快速入门! 下面是一些不错的书单,分享给大家,我也在拔草中,未来会把阅读笔记分享在我的公众号:python数据分析和 ...

  3. 基于python的数据建模与分析案例_基于案例详解Python数据分析与机器学习

    课程概述: 使用数据领域最主流语言Python及其分析与建模库作为核心武器.对于机器学习经典算法给出完整的原理推导并基于实例进行讲解,基于案例演示如何应用机器学习算法解决实际问题. 课程特色: 通俗易 ...

  4. 跟着迪哥学python 经管之家_跟着迪哥学Python数据分析与机器学习实战

    本书结合了机器学习.数据分析和Python语言,通过案例以通俗易懂的方式讲解了如何将算法应用到实际任务. 全书共20章,大致分为4个部分.第一部分介绍了Python的工具包,包括科学计算库Numpy. ...

  5. 01、python数据分析与机器学习实战——Python可视化库Seaborn

    seaborn简介 Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图. seaborn基础 i ...

  6. Python数据分析与机器学习

    Python基础知识和数据结构 基本的数据结构(Basic data structures) Name Nation Declaration e.g. Tuple 元组 tuple b = (1,2. ...

  7. python天气数据分析论文_《Python数据分析与机器学习实战-唐宇迪》读书笔记第9章--随机森林项目实战——气温预测(2/2)...

    第9章--随机森林项目实战--气温预测(2/2) 第8章已经讲解过随机森林的基本原理,本章将从实战的角度出发,借助Python工具包完成气温预测任务,其中涉及多个模块,主要包含随机森林建模.特征选择. ...

  8. python数据分析与机器学习(Numpy,Pandas,Matplotlib)

    机器学习怎么学? 机器学习包含数学原理推导和实际应用技巧,所以需要清楚算法的推导过程和如何应用. 深度学习是机器学习中神经网络算法的延伸,在计算机视觉和自然语言处理中应用更厉害一些. 自己从头开始做笔 ...

  9. 01、python数据分析与机器学习实战——python数据分析处理库-Pandas

    pandas介绍 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. panda ...

最新文章

  1. 常用排序算法的C++实现
  2. Maven笔记(2)-- 常用命令和标准的Maven项目结构
  3. (NO.00003)iOS游戏简单的机器人投射游戏成形记(七)
  4. 科大星云诗社动态20210329
  5. Superhero Transformation
  6. css实现垂直居中的几种方式(布局常用)
  7. 移动端下拉刷新原理和实例
  8. 这几部高分学科纪录片,助力孩子涨姿势拓视野~
  9. 【PyTorch】中view()==>相当于numpy中resize()、reshape()的功能
  10. url、href、src
  11. php实战第二十五天
  12. Android 系统(4)---Android HAL层与Linux Kernel层驱动开发简介
  13. 2022下半年,系统架构师论文写作相关知识点
  14. Wonderware配置-Intouch读取数据 6
  15. php日历表代码,PHP输出日历表代码实例
  16. websockets_Websockets在数据工程中鲜为人知的模式
  17. 抖音大数据,教你爬爬爬!
  18. docker-compose up -d --build不会更新镜像;什么时候容器会变更
  19. 软件设计师刷题与知识点总结 笔记
  20. org.apache.flink.shaded.guava18.com.google.common.util.concurrent.ThreadFactoryBuilder 真实解决方案

热门文章

  1. 手机火狐浏览html文件在哪里,火狐手机浏览器书签在哪?
  2. hadoop3 Yarn容量(Capacity Scheduler)调度器和公平(Fair Scheduler)调度器配置
  3. 新氧《2021中国医美抗衰消费趋势报告》:医美抗衰市场规模超755亿元
  4. 汇编 跳转指令: JMP、JCXZ、JECXZ、JA、JE、JNA、JNE、JZ、JB、JS、JC、JNC、JG、JNBE、JO、JP、JL、JPO、JGE、JLE 汇编语言
  5. 诺贝尔奖大数据告诉你:最聪明的星座是谁
  6. 【简历制作合集】面试时到底是用彩打简历还是黑白简历更出彩呢?|智测优聘出品
  7. 图灵计算机模型意义,图灵机计算模型的主要贡献是什么
  8. elasticse报错 max virtual memory areas vm.max_map_count [65530] is too low, increase to at leas
  9. linux组权限管理,Linux组管理和权限管理
  10. 通信电子电路(二十) 第一章复习+习题讲解