本文通过一个如何获得更高工资的案例讲解了如何通过直方图来分析是主动向老板提出加薪要求的员工获得了高薪,还是不主动提出加薪要求的员工获得了高薪的问题。

本文先提供了一些历史加薪原始数据,然后通过Excel直方图显示了不同加薪区间的数据情况,通过Excel显示的直方图中间存在缺口,引出用R语言生成直方图;从一张直方图中无法分析出问题,开始考虑从不同的维度生成不同的直方图来分析问题,找其原因。

直方图(Histogram),又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。

直方图是数值数据分布的精确图形表示。 这是一个连续变量(定量变量)的概率分布的估计,并且被卡尔·皮尔逊(Karl Pearson)首先引入。它是一种条形图。为了构建直方图,第一步是将值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。 这些值通常被指定为连续的,不重叠的变量间隔。间隔必须相邻,并且通常是(但不是必须的)相等的大小。

直方图也可以被归一化以显示“相对”频率。 然后,它显示了属于几个类别中的每个案例的比例,其高度等于1。

9.1 形状分析

9.1.1 概述

正常型是指过程处于稳定的图型,它的形状是中间高、两边低,左右近似对称。近似是指直方图多少有点参差不齐,主要看整体形状。如下图例:

异常型直方图种类则比较多,所以如果是异常型,还要进一步判断它属于哪类异常型,以便分析原因、加以处理。下面介绍几种比较常见的:

9.1.2 孤岛型

孤岛型直方图在直方图旁边有孤立的小岛出现,当这种情况出现时过程中有异常原因。如:原料发生变化,不熟练的新工人替人加班,测量有误等,都会造成孤岛型分布,应及时查明原因、采取措施。

9.1.3 双峰型

当直方图中出现了两个峰,这是由于观测值来自两个总体、两个分布的数据混合在一起造成的。如:两种有一定差别的原料所生产的产品混合在一起,或者就是两种产品混在一起,此时应当加以分层。

9.1.4 折齿型

当直方图出现凹凸不平的形状,这是由于作图时数据分组太多,测量仪器误差过大或观测数据不准确等造成的,此时应重新收集数据和整理数据。

9.1.5 陡壁型

当直方图像高山的陡壁向一边倾斜时,通常表现在产品质量较差时,为了符合标准的产品,需要进行全数检查,以剔除不合格品。当用剔除了不合格品的产品数据作频数直方图时容易产生这种陡壁型,这是一种非自然形态。

9.1.6 偏态型

偏态型直方图是指图的顶峰有时偏向左侧、有时偏向右侧。

由于某种原因使下限受到限制时,容易发生偏左型。如:用标准值控制下限,摆差等形位公差,不纯成分接近于0,疵点数接近于0或由于工作习惯都会造成偏左型。

由于某种原因使上限受到限制时,容易发生偏右型。如:用标准尺控制上限,精度接近100%,合格率也接近100%或由于工作习惯都会造成偏右型。

9.1.7 平顶型

当直方图没有突出的顶峰,呈平顶型,然而形成这种情况一般有三种原因。 A、与双峰型类似,由于多个总体、多总分布混在一起。 B、由于生产过程中某中缓慢的倾向在起作用,如工具的磨损、操作者的疲劳等。 C、质量指标在某个区间中均匀变化。

深入浅出数据分析 - 直方图相关推荐

  1. 《深入浅出数据分析》为读者送上了章回小说的精彩

    2010年2月,春节将至,我向博文视点的某个邮箱寄出了一封请求参加翻译任何一本图书的邮件.很快,有人回信,内容简单明了:请下载并试译第1章1~17页内容.落款是博文视点编辑徐定翔.于是我试译,寄出,然 ...

  2. 《深入浅出数据分析》第九章——R语言

    文章目录 记录第一次接触R语言 一.R语言下载安装 二.运行 三.补充 1.加载csv文件 2.hist函数 记录第一次接触R语言 <深入浅出数据分析>第九章讲到R语言,在这记录一下,就当 ...

  3. 深入浅出数据分析读书笔记

    深入浅出数据分析读书笔记 一.数据分析引言 1.数据分析的基本流程:确定--分解--评估--决策.一个完整的分析项目可能经过多轮流程 确定:客户的论点和数据 分解:将手头的资料汇总为有用的格式 评估: ...

  4. 《深入浅出数据分析》小结

    可以学到分析现实问题的系统性方法.从卖咖啡到开橡皮玩具厂,再到要求老板涨工资,此书告诉我们如何发现和解密数据在日常生活中的强大作用.从图形图表到Excel和R计算程序,<深入浅出数据分析> ...

  5. 《深入浅出数据分析》样章下载

    序言 真难以相信,他们竟把这些东西写进讲数据分析的书里了. 本节回答一个热门问题:"作者为什么非要把这些东西写进一本讲数据分析的书里?" 谁适合阅读本书? 请先回答几个问题: 1. ...

  6. 数据分析[1.2]--《深入浅出数据分析》1-分解数据

    //   学习<深入浅出数据分析>---分解数据 分解数据 如何处理所有的数据材料,如何将原始数据转变成推进现实工作的妙策,如何分解和构建复杂的问题和数据集,进而牢牢把握工作中各种问题的要 ...

  7. 【Python】数据分析——直方图、散点图、线性回归、多项式回归、拟合度

    目录 绘制直方图 绘制散点图 线性回归 多项式回归 拟合度 数据分析就是在一大批杂乱无章的数据中,运用数字化工具和技术,探索数据内在的结构和规律,构建数学模型,并进行可视化表达,通过验证将模型转化为知 ...

  8. 《深入浅出数据分析》第十二章——R语言lattice数据包

    文章目录 R语言 一.lattice数据包 二.jitter() R语言 这章比较重要的点就是lattice数据包. 然后就着重写一下这里. 一.lattice数据包 lattice包是一个非常强大的 ...

  9. 《深入浅出数据分析》第十三章

    文章目录 整理数据 一.Excel 二.正则表达式 三.去重 四.补充介绍正则表达式 整理数据 这章进行了简单的数据清洗. 一.Excel 一开始拿到散乱的数据,先用Excel进行分列. 散乱的数据: ...

  10. 《深入浅出数据分析》第十章第十一章

    文章目录 R语言 一.散点图 二.补充 R语言 从上一章开始,就都涉及到R语言的内容了,在这记录一下,就当给自己做的笔记. 一.散点图 这次要绘制的是散点图,并且求出它的回归方程. 首先,还是加载cs ...

最新文章

  1. 网络流最大流 Dinic算法模板
  2. python爬虫实例-记录一次简单的Python爬虫实例
  3. JAVA enum实现简单状态机功能
  4. 【Heritrix基础教程之4】开始一个爬虫抓取的全流程代码分析
  5. 【POJ - 1459】Power Network(网络流最大流,建图)
  6. java 获得文件的行数据_Java 读取文件指定行数据
  7. 利用MindManager,制作简易的漏斗图
  8. 【使用Markdown自动生成目录的几种方法】
  9. 拆机芯片DIY一个STM32F401CCU6核心板
  10. 现货白银的最小交易单位
  11. cocos creator周边工具开发【spine预览】小记
  12. 学生运动会成绩数据库
  13. LWN:使用Rust实现OpenPGP,这就是Sequoia项目!
  14. 用VB操作Excel(VB6.0)(整理)
  15. 不同地域的内容偏好性分析
  16. 先有鸡还是先有蛋:数据库中的相互依赖
  17. macOS系统更新下载太慢?官方原版系统高速下载教程
  18. Super PI linux 版本最新可用
  19. swift4.1 系统学习六
  20. 学生信息录入java,基于java的学生信息管理系统

热门文章

  1. 2020爱分析·智能通讯云厂商全景报告
  2. c语言程序设计实践教程课后题,《C语言程序设计实践教程》答案-完整版.doc
  3. 顺序结构程序设计总结
  4. 高质量计算机学习网站
  5. PMP 第六版 p25 矩阵图 方便记忆 口诀
  6. mysql数据库机器人,机器人之解析远程连接管理其他机器上的MYSQL数据库
  7. 【组合数学】组合恒等式 ( 八个组合恒等式回顾 | 组合恒等式 积 1 | 证明 | 使用场景 | 求组合数通用方法 )
  8. 【自动控制原理】 时域分析法
  9. tp5 mysql 使用ignore_tp5数据库配置操作
  10. 一套功能强大的点云数据处理软件!