//2019.07.23

1、箱形图,又称为盒式图,一般可以很好地反映出数据分布的特征,也可以进行多项数据之间分布特征的比较,它主要包含五个基础数据:中位数,两个上下分位数以及上下边缘线数据

其中的一些参数具体含义及其计算过程如下:

2、双轴图的绘制代码:

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

plt.rcParams["font.sans-serif"]=["SimHei"] #输出图像的标题可以为中文正常输出

plt.rcParams["axes.unicode_minus"]=False #可以正常输出图线里的负号

import warnings

warnings.filterwarnings("ignore") #忽略相应的警告信息

df=pd.read_excel("D:/Byrbt2018/Study/Python数据分析课程+练习+讲解/Python数据分析课程+练习+讲解/作业/作业4/作业4/酒店数据1.xlsx")#导入w我们的表格数据文件

print(df)

print(df.index)

print(df.columns)

d=df[:5]

print(d)

2、#双轴图的绘制.twinx()

import matplotlib.mlab as mlab

fig=plt.figure(figsize=(10,8))

ax1=fig.add_subplot(1,1,1)

n,bins,patches=ax1.hist(df["评分"],bins=100,color="m")

ax1.set_ylabel("电影数量",fontsize=15)

ax1.set_xlabel("评分",fontsize=15)

ax1.set_title("频率分布直方图",fontsize=20)

y=mlab.normpdf(bins,df["评分"].mean(),df["评分"].std()) #生成正态分布函数

ax2=ax1.twinx() #定义新的双轴图函数

ax2.plot(bins,y,"b--")

ax2.set_ylabel("概率分布",fontsize=15)

3、#散点图的绘制plt.scatter(x,y)绘制散点图

x=df["评分人数"][::10]

y=df["评分"][::10] #隔10个点进行选取数据点

plt.figure(2)

plt.scatter(x,y,color="r",marker="p") #散点图函数图像输出

plt.xlabel("评分",fontsize=15)

plt.ylabel("评分人数",fontsize=15)

plt.title("酒店评分与人数散点图",fontsize=20)

4、#箱线图的绘制

d=df[df.类型=="商务出行"]["评分"]

print(d)

plt.figure(4)

plt.boxplot(d,whis=1.5,flierprops={"marker":"o","markerfacecolor":"r","color":"g"},patch_artist=True,boxprops={"color":"k","facecolor":"g"})

#箱线图的格式设置和调整

plt.title("商务出行酒店的评分数据分布",fontsize=17)

#多组数据的箱线图

d1=df[df.类型=="浪漫情侣"]["评分"]

d2=df[df.类型=="地铁周边"]["评分"]

d3=df[df.类型=="休闲度假"]["评分"]

d4=df[df.类型=="海滨风光"]["评分"]

d5=df[df.类型=="交通方便"]["评分"]

d6=df[df.类型=="商务出行"]["评分"]

plt.figure(5)

plt.boxplot([d1,d2,d3,d4,d5,d6],labels=["浪漫情侣","地铁周边","休闲度假","海滨风光","交通方便","商务出行"],whis=1.5,flierprops={"marker":"o","markerfacecolor":"r","color":"g"},patch_artist=True,boxprops={"color":"k","facecolor":"g"}

,vert=True) #多组数据分布特征比较,vert决定了整体图像的横向与纵向

#坐标轴的编辑与改变

ax=plt.gca() #坐标轴的编辑与改变

ax.patch.set_facecolor("white") #设置坐标轴的背景颜色

ax.patch.set_alpha(0.3) #设置配色和透明度

plt.title("不同类型酒店的评分箱线图",fontsize=20)

plt.xlabel("酒店类型",fontsize=15)

plt.ylabel("评分大小",fontsize=15)

#相关系数矩阵图

df1=df[["评分","评分人数"]]

df1["排序"]=np.random.randint(1,100,396)

print(df1)

r1=pd.scatter_matrix(df1,diagonal="kde",color="k",alpha=0.3,figsize=(10,10))

#对于多个数据减的散点图绘制函数参数设置,diagonal表示对角线图像kde/hist(数据密度图或者直方图选择)

5、#相关系数热力图

import seaborn as sns

corr=df1.corr()

corr=abs(corr)

ax=plt.figure(figsize=(10,8))

ax=sns.heatmap(corr,vmax=1,vmin=0,annot=True,annot_kws={"size":13,"weight":"bold"},linewidth=0.05)

plt.xticks(fontsize=15)

plt.yticks(fontsize=15)

plt.xlabel("数据名称",fontsize=15)

plt.ylabel("数据名称",fontsize=15)

plt.title("不同数据间相关系数矩阵图",fontsize=20)

plt.show()

整体运行代码如下:

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

plt.rcParams["font.sans-serif"]=["SimHei"] #输出图像的标题可以为中文正常输出

plt.rcParams["axes.unicode_minus"]=False #可以正常输出图线里的负号

import warnings

warnings.filterwarnings("ignore") #忽略相应的警告信息

df=pd.read_excel("D:/Byrbt2018/Study/Python数据分析课程+练习+讲解/Python数据分析课程+练习+讲解/作业/作业4/作业4/酒店数据1.xlsx")#导入w我们的表格数据文件

print(df)

print(df.index)

print(df.columns)

d=df[:5]

print(d)

#双轴图的绘制.twinx()

import matplotlib.mlab as mlab

fig=plt.figure(figsize=(10,8))

ax1=fig.add_subplot(1,1,1)

n,bins,patches=ax1.hist(df["评分"],bins=100,color="m")

ax1.set_ylabel("电影数量",fontsize=15)

ax1.set_xlabel("评分",fontsize=15)

ax1.set_title("频率分布直方图",fontsize=20)

y=mlab.normpdf(bins,df["评分"].mean(),df["评分"].std()) #生成正态分布函数

ax2=ax1.twinx() #定义新的双轴图函数

ax2.plot(bins,y,"b--")

ax2.set_ylabel("概率分布",fontsize=15)

#散点图的绘制plt.scatter(x,y)绘制散点图

x=df["评分人数"][::10]

y=df["评分"][::10] #隔10个点进行选取数据点

plt.figure(2)

plt.scatter(x,y,color="r",marker="p") #散点图函数图像输出

plt.xlabel("评分",fontsize=15)

plt.ylabel("评分人数",fontsize=15)

plt.title("酒店评分与人数散点图",fontsize=20)

#箱线图的绘制

d=df[df.类型=="商务出行"]["评分"]

print(d)

plt.figure(4)

plt.boxplot(d,whis=1.5,flierprops={"marker":"o","markerfacecolor":"r","color":"g"},patch_artist=True,boxprops={"color":"k","facecolor":"g"})

#箱线图的格式设置和调整

plt.title("商务出行酒店的评分数据分布",fontsize=17)

#多组数据的箱线图

d1=df[df.类型=="浪漫情侣"]["评分"]

d2=df[df.类型=="地铁周边"]["评分"]

d3=df[df.类型=="休闲度假"]["评分"]

d4=df[df.类型=="海滨风光"]["评分"]

d5=df[df.类型=="交通方便"]["评分"]

d6=df[df.类型=="商务出行"]["评分"]

plt.figure(5)

plt.boxplot([d1,d2,d3,d4,d5,d6],labels=["浪漫情侣","地铁周边","休闲度假","海滨风光","交通方便","商务出行"],whis=1.5,flierprops={"marker":"o","markerfacecolor":"r","color":"g"},patch_artist=True,boxprops={"color":"k","facecolor":"g"}

,vert=True) #多组数据分布特征比较,vert决定了整体图像的横向与纵向

#坐标轴的编辑与改变

ax=plt.gca() #坐标轴的编辑与改变

ax.patch.set_facecolor("white") #设置坐标轴的背景颜色

ax.patch.set_alpha(0.3) #设置配色和透明度

plt.title("不同类型酒店的评分箱线图",fontsize=20)

plt.xlabel("酒店类型",fontsize=15)

plt.ylabel("评分大小",fontsize=15)

#相关系数矩阵图

df1=df[["评分","评分人数"]]

df1["排序"]=np.random.randint(1,100,396)

print(df1)

r1=pd.scatter_matrix(df1,diagonal="kde",color="k",alpha=0.3,figsize=(10,10))

#对于多个数据减的散点图绘制函数参数设置,diagonal表示对角线图像kde/hist

#相关系数热力图

import seaborn as sns

corr=df1.corr()

corr=abs(corr)

ax=plt.figure(figsize=(10,8))

ax=sns.heatmap(corr,vmax=1,vmin=0,annot=True,annot_kws={"size":13,"weight":"bold"},linewidth=0.05)

plt.xticks(fontsize=15)

plt.yticks(fontsize=15)

plt.xlabel("数据名称",fontsize=15)

plt.ylabel("数据名称",fontsize=15)

plt.title("不同数据间相关系数矩阵图",fontsize=20)

plt.show()

输出结果如下:

python画相关系数矩阵图_pyhton中matplotlib箱线图的绘制(matplotlib双轴图、箱线图、散点图以及相关系数矩阵图))...相关推荐

  1. python画三维设置坐标_Python中三维坐标空间绘制的实现

    在三维空间绘制点,线,面 1.绘制点 用scatter()散点绘制三维坐标点 from matplotlib import pyplot as plt from mpl_toolkits.mplot3 ...

  2. python画熊猫论文_Python数据可视化之美:专业图表绘制指南(全彩)

    Python数据可视化之美:专业图表绘制指南(全彩)电子书 系统性地介绍Python 的绘图语法系统,包括matplotlib.Seaborn.plotnine 包,以及用于地理空间数据可视化的Bas ...

  3. python画立体图形代码_python中如何画三维的图形?

    之前教了大家不少简单的画图方法,有的小伙伴已经想尝试更漂亮的高难度图形.小编找到了一个简单容易上手的分享给大家. 如果需要绘制三维的图形,matlab可以,python同样可以,代码风格也是极其的与m ...

  4. python防止源码泄露_Pyhton中防止SQL注入的方法

    c=db.cursor() max_price=5 c.execute("""SELECT spam, eggs, sausage FROM breakfast WHER ...

  5. 用python画苹果_Python爬取京东Iphone X用户评论并绘制词云

    目标爬取京东商城上iPhone X用户评论数据: 使用jieba对评论数据进行分词处理: 使用wordcloud绘制词云图. 目前京东商城只会展示商品的前100页评论,所以我们能爬取到的评论只有100 ...

  6. python画米老鼠图片_简笔画:如何使用Flash绘制米老鼠,看完你学会了么

    米老鼠,是迪士尼的形象代表,它以随和乐观的性格受到了广大观众的喜爱.现在,我们以实际的例子出发,看看如何使用Flash绘制米老鼠卡通图案吧. 工具/材料 Flash 操作方法 01 新建文档 双击桌面 ...

  7. python画roc曲线需要什么数据,我如何根据这些数据绘制ROC曲线?

    使用CNN训练的神经网络(CNN)进行以下精度测试:for root, dirs, files in os.walk(test_directory): for file in files: img = ...

  8. python画超长图-python 画长图

    广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 最近遇到个任务需要画一些坐标图,我就在想,用了这么长时间的 python 了,能不 ...

  9. 如何用python画出中国地图-用Python画中国地图(二)

    在上一篇文章<用Python画一个中国地图>中,我们简单描述了一下如何用Python快速画出一个中国地图的轮廓,似乎没有什么实用价值,这一次我们用实际数据填充它,使它看上去更有意义. 上色 ...

最新文章

  1. GitLab 上市,市值高达 149 亿美元!GitHub 的头号劲敌来了
  2. android恶意代码检测报告,用机器学习检测Android恶意代码
  3. Python-3.7.0
  4. 后台系统可扩展性学习笔记(十)Database Partitioning
  5. 关于内存的一些基础知识
  6. RISC-V踩坑记----__builtin_clz((x)库函数的应用
  7. 论文浅尝 | 使用预训练深度模型和迁移学习方法的端到端模糊实体匹配
  8. Qt5.8 Windows端 关于 Style Plugin Example 官方实例中的错误
  9. 集合的体系结构 0119
  10. 用matlab录制声音然后进行读取和播放
  11. mysql的数据备份问题_mysql数据库备份的问题
  12. 【Interfacenavigation】按钮(29)
  13. 小程序抽象组件使用示例
  14. 用matlab给图像加水印,大神,在MATLAB中将图像水印插入音频文件可否给我个具体的步骤啊!很着急​...
  15. 【数据分享】错颌畸形生长患者治疗数据集
  16. 也谈谈让好马吃回头草
  17. django模板-if标签、for标签、自定义标签和过滤器
  18. 质性数据分析软件NVivo教程:自动编码情感
  19. labview与android,LabVIEW与Android手机的无线视频实时传输
  20. 初一学生上计算机教学内容,初一计算机教学工作计划.docx

热门文章

  1. win10电脑开机密码忘了怎么办_电脑开机密码忘了怎么办最简单的方法_windows7教程...
  2. php 去除重复的值,php数组怎么去除重复值?
  3. 无监督和有监督的区别_机器学习和人工智能之间的区别
  4. cmake 安装_linux下安装cmake
  5. linux配置libpng环境变量_不同操作系统下 jdk 的配置
  6. Linux 如何开启SFTP
  7. 基于element ui的收起展开检索条件效果
  8. python time模块和random 模块
  9. 基于JQuery做的一个简单的点击显示和隐藏的小Demo
  10. HTML学习思维导图