点击上方『早起python』关注早起

和我一起,成为更好的自己

前言

在前几天对数据分析师与算法工程师进行岗位对比分析的文章中,我们使用了密度分布图和箱线图对薪资水平与学历对薪资的影响进行了分析,那么早起就对这两种图形的绘制方法进行解析,也借着这个机会讲一下我最喜欢的绘图包:ggplot2

密度分布图

频率分布直方图中,当样本容量充分放大时,图中的组距就会充分缩短,这时图中的阶梯折线就会演变成一条光滑的曲线,这条曲线就称为总体的密度分布曲线。这条曲线排除了由于取样不同和测量不准所带来的误差,能够精确地反映总体的分布规律,密度分布图其实就是密度分布曲线的填充。

原文的的密度分布图的绘制软件为R,为啥不用Python?研究了一圈绘制出来图形都不够好看那么具体怎么画呢?首先把数据整理成这样????

一列是职位名称一列是对应的薪资,然后启动R读取数据并修改两个列名

#读取数据
data = read.csv('gongzi.csv')
#修改列名
names(data)[1:2]<-c("professional","salary")

接着使用下面的代码加载ggplot2,并设置x轴,此时图形长这样????

接下来我们使用下面代码添加密度曲线

p + geom_density()

此时虽然整出来密度曲线,但是并没有根据两个岗位进行区分,因此我们使用下面代码区分开两个岗位,注意里面函数里面color就是指定岗位

p + geom_density(aes(color = professional))

OK,成功对不同岗位进行了区分,只剩下最后一步填充,并且有没有发现坐标轴是以科学计数法呈现的,我们也对这一块处理一下

options(scipen=200)
p + geom_density(aes(fill = professional), alpha=0.4) + xlim(0,80000)

options(scipen=200)就是用来处理坐标轴的科学计数法,并且我们的x轴不需要那么大的范围,因此使用xlim(0,80000)来调整,这样我们就做出了漂亮的密度分布图

为了读者可以从图中读到更多信息,我们再将两个岗位的平均薪资线添加进去,首先计算两个岗位的平均薪资并创建为dataframe

接着使用下面一行命令即可

p + geom_density(aes(fill = professional), alpha=0.4) + xlim(0,80000) + geom_vline(data = mean, aes(xintercept = salary,color=professional),linetype="dashed")

来看看最终效果,学会了吗

结束语

以上就是使用R绘制漂亮的密度分布图过程,我已将原始数据放在公众号后台回复招聘获取,感兴趣的读者可以利用原始数据自己使用python进行处理得到我们需要的数据格式再绘制,最后留一个问题,怎样绘制学历关于薪资的箱线图?怎样实现箱子大小根据不同样本量而变化?且看下回推文。

往期内容(????猛戳可查看)

热门文章:

➤情人节网站➤岗位对比分析➤爬取网易云音乐

➤爬取钉钉评价➤自动追踪快递➤Python画樱花树

➤Python斗地主➤Matplotlib神器➤全球疫情动态图

数据分析:

➤统计检验➤数据分析报告➤数据分析技巧

➤数据可视化➤Pandas学习➤缺失值处理

➤Python库整理➤数据降维➤疫情数据汇总

记得点个在看支持下~????

技术解析|如何绘制密度分布图相关推荐

  1. 聚类中心-最邻近交叉口距离密度分布图

    import matplotlib.pyplot as plt from matplotlib.pyplot import MultipleLocator#从pyplot导入MultipleLocat ...

  2. UWP 手绘视频创作工具技术分享系列 - 文字的解析和绘制

    本篇作为技术分享系列的第二篇,详细讲一下文字的解析和绘制,这部分功能的研究和最终实现由团队共同完成,目前还在寻找更理想的实现方式. 首先看一下文字绘制在手绘视频中的应用场景 文字是手绘视频中很重要的表 ...

  3. 城市三维地理信息可视化 技术解析

    一.三维地理信息系统分析空间数据的科学工具 三维地理信息系统,即三维GIS,是对包括大气层在内的地球表层,与地理有关的数据进行采集.储存.管理.运算.分析.显示和描述的技术系统. 基于三维GIS将现实 ...

  4. 虚幻四中怎么保持导入模型坐标_[CG分享]|虚幻引擎5 技术解析

    今天还是跟大家聊一聊最近很火的虚拟引擎,Epic Game公司的虚幻引擎5惊艳了全球游戏业,其Nanite虚拟微多边形几何技术和Lumen动态全局光照技术带来了产业界的飞跃.Nanite虚拟几何技术的 ...

  5. 现代前端技术解析读书笔记

    思维导图链接:http://v3.processon.com/view/link/5f7ec592762131119546c899 取材自<现代前端技术解析> 本文只是个人读书笔记,更多详 ...

  6. 原生革命--跨平台开发技术解析

    这篇文章,我将着重分析当前主流跨平台开发解决方案(偏架构)如Flutter.RN.Weex.Hybrid App,并对新晋跨端解决方案Fusion和Chameleon做一些分析,在传统原生开发不断被唱 ...

  7. 应用计算机散热的原理是什么,计算机散热的原理与技术解析[中].doc

    散热的原理与技术解析-中(1) 在本文的第一部分,我们主要探讨了如何快速将热量带离热源,主要涉及热传递三种基本方式中的热传导方面.但对一个完整的散热器而言,这是远远不够的,因为这样只是将热量转移到散热 ...

  8. python 密度图_Python-Matplotlib做二维密度分布图

    之前一直想尝试着用Matplotlib绘制计算结果中的二维密度分布图,这样即省去了许多数据处理的麻烦,也方便直接在Linux系统中观察计算的结果.但对Numpy和Maltplotlib的熟练程度还不够 ...

  9. 现代前端技术解析:Web前端技术基础

    ​ 最近几年,越来越多的人投入到前端大军中:时至至今,前端工程师的数量仍然不能满足企业的发展需求:与此同时,互联网应用场景的复杂化提高了对前端工程师能力的要求,一部分初期前端工程师并不能胜任企业的工作 ...

最新文章

  1. caffe 的命令行训练与测试
  2. ExpressionFuncT,TResult和FuncT,TResult
  3. CSS样式表——超链接样式
  4. 我们应该学习什么 java、C#还是C++(VC)
  5. android 获取控件高度_安卓开发入门教程UI控件_ProgressBar
  6. 题目1022:游船出租(结构体使用)
  7. 中国抗衰老护肤品市场趋势报告、技术动态创新及市场预测
  8. linux嵌入式如何学习,嵌入式Linux要如何学习?嵌入式linux学习路线讲解
  9. html文件form根目录,HTML ,form 和 link 使用根目录 的问题,我已经上图了!
  10. 千图成像python_Python---如何实现千图成像:初级篇(从图片爬取到图片合成)
  11. 树莓派 python驱动蜂鸣器
  12. 吉林省等保测评机构项目测评收费价格标准参考
  13. miflash刷机:fastboot模式/保留数据刷机
  14. 怎么使用计算机自带的摄像头拍视频,电脑怎么用摄像头录制视频
  15. unity3D -- 压缩图片
  16. 计算机专业的创新方向和创业情况,计算机专业创新创业教育模式探究
  17. 贪心入门+10道例题+解析代码
  18. dolphinschedule2.0.5升级dolphinschedule3.1.1
  19. RTX3060Ti和RTX2060 SUPER,RTX2080 SUPER、RTX3070显卡参数参数对比哪个好 差距大不大
  20. 【微信小程序】生命周期

热门文章

  1. 闲置宽带 | 彼度云两分钟教你选对产品
  2. Haroopad安装运行提示缺少libgconf
  3. RH124---Linux基础测试题
  4. Java 方法的概述-方法的定义-带参数的方法
  5. 魔幻2020年,生活远没有你以为的那么安稳
  6. 并行与分布式计算导论—性能分析
  7. 下月学习计划~2023/05
  8. 如何快速去除水印?大神教你绝招,3秒就能搞定
  9. EMQTT benchmark测试
  10. 手把手教你使用EventBus