前言

声明:这个系列的博文都是我自己学习所得的东西,秉承着每天进步一点点的理念进行学习,我参考的课程是《菊安酱与菜菜的Python机器学习可视化50图》,使用的Python版本为3.6.4。
今天学习的内容气泡图的绘制,这种图与散点图有很多相似之处,所以可以借鉴散点图的代码进行制作。

分步骤解析气泡图的绘制方法

1.我们在复杂散点图绘制的基础上对代码进行修改,使之变为气泡图,原始代码如下:

import numpy as np #数学处理库
import pandas as pd #用于处理.csv excel html 文本等文件
import matplotlib as mpl #画图像的库
import matplotlib.pyplot as plt #画二维图像的库
import seaborn as sns #颜色库
watch_data1=datasets.head()
#print(watch_data1)
watch_data2=datasets.columns
#print(watch_data2)
#准备标签
watch_cat=datasets['category']
#print(watch_cat)#查看原始标签categories=np.unique(datasets['category'])#去掉重复项
#print(categories)#查看去重后类别
#print(len(categories))#查看有几个类别#准备颜色
'''colorx=plt.cm.tab10(5.2)#从tab10色带中取出一个颜色x1=np.random.randn(10)
x2=x1+x1**2-10
plt.scatter(x1,x2,s=50,c=np.array(colorx).reshape(1,-1))plt.show()'''#开始绘制复杂散点图
#我们需要循环和类别数目一样的次数,目前有14各类别
#我们用循环的i来生成小数,这样就可以生成不同的颜色#以下两个步骤可以去掉图例的边框
plt.style.use('seaborn-whitegrid')#设定整体风格
sns.set_style("white")#设置背景
plt.figure(figsize=(16,10),dpi=120,facecolor='w',edgecolor='k')#定义画布,分辨率,背景,边框for i in range (len(categories)):plt.scatter(datasets.loc[datasets["category"]==categories[i],"area"],datasets.loc[datasets["category"]==categories[i],"poptotal"],s=20,c=np.array(plt.cm.tab10(i/len(categories))).reshape(1,-1),label=categories[i])#开始装饰
plt.gca().set(xlim=(0.0,0.12),ylim=(0,80000))#控制横纵坐标的范围
plt.xticks(fontsize=12)
plt.yticks(fontsize=12)
plt.ylabel('Population',fontsize=22)
plt.xlabel('Area',fontsize=22)
plt.title("scatterplot of midwest Area vs Population",fontsize=22)
plt.legend(fontsize=12)
plt.show()

2.开始修改,我们要产生气泡图的实质是要让点的大小随着某一个类别的值的大小而变化,那么,就是要对s参数进行改变。我们之前可以让颜色变化同理就可以让点的尺寸变化,修改下面的代码看看效果,主要看s的部分:

plt.scatter(datasets.loc[datasets["category"]==categories[i],"area"],datasets.loc[datasets["category"]==categories[i],"poptotal"],s=datasets.loc[datasets["category"]==categories[i],"popasian"],c=np.array(plt.cm.tab10(i/len(categories))).reshape(1,-1),label=categories[i])


3.这时候基本上出现了我们想要的东西,但是存在很多问题,我们一一来解决:
问题1:点的颜色不透明,符号不好看,不是我们想要的;
加入下面的代码我们再来看看,增加了透明度,边缘颜色,边缘线宽参数之后:

plt.scatter(datasets.loc[datasets["category"]==categories[i],"area"],datasets.loc[datasets["category"]==categories[i],"poptotal"],s=datasets.loc[datasets["category"]==categories[i],"popasian"],c=np.array(plt.cm.tab10(i/len(categories))).reshape(1,-1),label=categories[i],alpha=0.7,edgecolors=np.array(plt.cm.tab10(i/len(categories))).reshape(1,-1),linewidths=0.5)#透明度,边缘颜色,边缘线宽


问题2:以人数绝对值为点的大小不合理,最好使用占比表达,但是占比的数值都比较小,怎么能使用它呢?
我们可以整体给占比乘一个比较大的数,扩大以后,显示就没有问题了,代码修改和效果如下:

问题3:气泡图整饰的问题,图例很难看,点超出范围了,图名不正确。

#开始装饰
plt.gca().set(xlim=(0.0,0.12),ylim=(0,90000))#控制横纵坐标的范围
plt.xticks(fontsize=12)
plt.yticks(fontsize=12)
plt.ylabel('Population',fontsize=22)
plt.xlabel('Area',fontsize=22)
plt.title("Bubble Plot with Encircling",fontsize=22)
plt.legend(fontsize=12,markerscale=0.5)#现有图例的0.5倍
plt.show()

完整代码及效果

#Author:Albert(CSDN:一个跻身科研大浪的小白)
#Time:2020/03/23
#usage:气泡图import numpy as np #数学处理库
import pandas as pd #用于处理.csv excel html 文本等文件
import matplotlib as mpl #画图像的库
import matplotlib.pyplot as plt #画二维图像的库
import seaborn as sns #颜色库datasets=pd.read_csv("http://raw.githubusercontent.com/selva86/datasets/master/midwest_filter.csv")#由原博主提供的在线数据集直接导入categories=np.unique(datasets['category'])#去掉重复项#以下两个步骤可以去掉图例的边框
plt.style.use('seaborn-whitegrid')#设定整体风格
sns.set_style("white")#设置背景
plt.figure(figsize=(16,10),dpi=120,facecolor='w',edgecolor='k')#定义画布,分辨率,背景,边框for i in range (len(categories)):plt.scatter(datasets.loc[datasets["category"]==categories[i],"area"],datasets.loc[datasets["category"]==categories[i],"poptotal"],s=datasets.loc[datasets["category"]==categories[i],"popasian"],c=np.array(plt.cm.tab10(i/len(categories))).reshape(1,-1),label=categories[i],alpha=0.7,edgecolors=np.array(plt.cm.tab10(i/len(categories))).reshape(1,-1),linewidths=0.5)#透明度,边缘颜色,边缘线宽#开始装饰
plt.gca().set(xlim=(0.0,0.12),ylim=(0,90000))#控制横纵坐标的范围
plt.xticks(fontsize=12)
plt.yticks(fontsize=12)
plt.ylabel('Population',fontsize=22)
plt.xlabel('Area',fontsize=22)
plt.title("Bubble Plot with Encircling",fontsize=22)
plt.legend(fontsize=12,markerscale=0.5)#现有图例的0.5倍
plt.show()

下期预告

实质上感觉依然不是很明朗,下期在图像上加文字,然后再处理图例使之更加美观。

Python数据可视化学习笔记:第一章 关联图 第四节 使用Python绘制一般气泡图相关推荐

  1. python气象数据可视化学习笔记6——利用python地图库cnmaps绘制地图填色图并白化

    文章目录 1. 效果图 2. cnmaps简介及安装 2.1 写在前面 2.2 cnmaps简介和安装 3. 导入库 4. 定义绘图函数 4.1 使用get_adm_maps返回地图边界 4.2 ax ...

  2. 《Go语言圣经》学习笔记 第一章 Go语言入门

    Go语言圣经学习笔记 第一章 Go语言入门 目录 Hello, World 命令行参数 查找重复的行 GIF动画 获取URL 并发获取多个URL Web服务 本章要点 注:学习<Go语言圣经&g ...

  3. Python数据可视化学习(初学中...)

    Python数据可视化学习(初学中...) 1.使用Matplotlib生成数据图 1.1.安装Matplotlib包 1.2.Matplotlib数据图入门 1.2.1.折线图举例 1.2.2.图表 ...

  4. 小吴的《机器学习 周志华》学习笔记 第一章 绪论

    小吴的<机器学习 周志华>学习笔记 第一章 绪论 近一年时间接触到不少机器学习的知识,虽然断断续续学了一些,总感觉还没有入门(只学会了疯狂调包).因此,最近开始系统学习Machine Le ...

  5. 计算机网络学习笔记---第一章

    计算机网络学习笔记 第一章 文章目录 计算机网络学习笔记 第一章 前言 一.计算机网络的概念 (一)计算机网络的功能 1.数据通信(连通性) 2.资源共享(硬件 软件 数据) 3.分布式处理 (Had ...

  6. ECharts数据可视化学习笔记和应用

    ECharts数据可视化学习笔记和应用 一.概念 二.Echarts使用 使用步骤 三.Echarts-基础配置 四.柱状图图表1 五.柱状图图表2 六.折线图1 七.折线图2 八.饼状图1 九.饼形 ...

  7. PhalAPI学习笔记 ——— 第一章自定义HelloWorld接口

    PhalAPI学习笔记 --- 第一章自定义HelloWorld接口 前言 自定义接口 项目实例 结果 分布解析 结束语 前言 公司业务需要转学PHP,而PHP中一个功能强大且生态链完整的PHP接口框 ...

  8. 编译原理(龙书)学习笔记 第一章

    编译原理(龙书)学习笔记 第一章 1.1语言处理器 解释器(interpreter) : 编译器(compiler): 一个语言处理系统 练习 1.1.1:编译器和解释器之间的区别 1.1.2:相对优 ...

  9. 机器人导论(第四版)学习笔记——第一章

    机器人学导论(第四版)学习笔记--第一章 1. 概述 1.1 背景 1.2 操作臂力学和控制 1.3 符号 1. 概述 1.1 背景 工业自动化的发展带来了工业机器人的高速发展.本书聚焦机械臂的力学和 ...

最新文章

  1. nginx conf 文件
  2. 我理解的javascript事件循环(一)
  3. Android自动化测试(UiAutomator)简要介绍
  4. 复数基础——虚数和复数_5
  5. 深度学习之OCR相关经验记录
  6. 孙茂松教授——自然语言处理一瞥:知往鉴今瞻未来
  7. latex数学符号加粗_LaTex数学公式符号整理
  8. 天线设计相关性能参数
  9. springboot 项目中用doc转成PDF
  10. Vue动态循环背景图片
  11. 万物可运算——运算符重载(四)
  12. Windows自定义域名跳转指定网址
  13. MBA-day13数学-年龄问题-应用题
  14. 辨别 利用AAC转成无损格式音乐 的假无损
  15. Java新手小白入门篇 Java项目的构建
  16. 检验下载文件完整性、真实性——SHA256校验值
  17. AIBlockChain:“知名博主独家讲授”人工智能创新应用竞赛【精选实战作品】之《基于计算机视觉、自然语言处理、区块链和爬虫技术的智能会议系统》软件系统案例的界面简介、功能介绍分享之二、会中智能
  18. Elastic 极客时间 阮一鸣 学习笔记_入门
  19. 华为交换机配置mac地址白名单接入
  20. AutoJs学习-实现扫雷

热门文章

  1. 最大回撤率 和 移动数组零元素到末尾
  2. zabbix监控域名到期时间
  3. webrtc ns模块代码公式详细解读
  4. 第二周(9.14-9.20)学习任务报告
  5. 通过掩码计算IP范围
  6. 考研 英语一 大作文-图画作文 (一)----第一段描述图画写作攻略
  7. 作业盒子端AndrOid,作业盒子小学老师端
  8. 【随机过程】第二章——随机过程概论
  9. 【Linux】第二篇:Linux环境及开发工具
  10. 2021-08-31 CoreDNS:Kubernetes内部域名解析原理、弊端及优化方式