数据源

百度网盘:
链接:https://pan.baidu.com/s/1EKxDdJDNqhqzucK6eH0Rew?pwd=1234
提取码:1234

数据字段及解释

导入数据

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
data = pd.read_csv('C:\\Users\\86199\\Desktop\\HR_comma_sep.csv')
data.head()

在职情况分析

left_rate=data.left.value_counts()/14999
left_rate

数据中不同薪水占比

不同薪水占比 = data.salary.value_counts()/ 14999
不同薪水占比

查看工作类型以及其与工资,工作时长的关系

data.sales.unique()     #工作类型
data1 = data.groupby(['salary','sales'])['average_montly_hours'].mean().unstack(0)
%matplotlib inline
data1.plot.bar(rot = 60)   #以柱状图的形式展现工资,工作类别和月工时之间的关系
#发现IT类工作,工资越高反而工作时长越低

查看工作类型以及其与工资,工作满意度的关系

data1 = data.groupby(['salary','sales'])['satisfaction_level'].mean().unstack(0).plot(rot = 60)

相关性分析

data['sales'].replace(list(pd.Series(data['sales']).unique()),np.arange(10),inplace=True)   #把非数值数据转化成数值数据
data['salary'].replace(list(pd.Series(data['salary']).unique()),[0,1,2],inplace=True)
##把left列移到表的前面,方便分析
front=data['left']
data.drop(labels='left',axis=1,inplace=True)
data.insert(0,'left',front)
data.head()

data.corr()
sns.heatmap(data.corr())

项目数量与是否离职的关系

ax = sns.countplot(x="number_project", hue="left", data=data)
#当项目数量为2,6,7时, 员工更容易离职。
#项目数量为7 的员工全部离职

人力资源数据分析(包含数据来源文件)相关推荐

  1. 解读:大数据分析及其数据来源

    当我们谈到大数据分析,首先需要确定数据分析的方向和拟解决的问题,然后才能确定需要的数据和分析范围.大数据驱动的分析主要的挑战不是技术问题,而是方向和组织领导的问题,要确定方向,提出问题,需要对行业做深 ...

  2. 大数据分析的“数据来源”有哪些?

    当我们谈到大数据分析,首先需要确定数据分析的方向和拟解决的问题,然后才能确定需要的数据和分析范围.大数据驱动的分析主要的挑战不是技术问题,而是方向和组织领导的问题,要确定方向,提出问题,需要对行业做深 ...

  3. Airbnb数据分析(数据来源:kaggle)

    使用工具:sql.Tableau 一.分析背景 Airbnb介绍:Airbnb是AirBed and Breakfast ("Air-b-n-b")的缩写,是一家联系旅游人士和家有 ...

  4. 数据分析的数据来源都有哪些?

    数据的获取方式: 1.获取外部的公开数据集, UCI 加州大学欧文分校开放的经典数据集,被很多数据挖掘实验室采用   http://archive.ics.uci.edu/ml/datasets.ht ...

  5. 大数据分析数据来源的有哪些类型

    在数据量巨大的今天,如何以更高的效率获取分析所需的数据,以及如何利用这些数据反映最真实的情况,是业界不断讨论的话题.接下来,就带大家来了解下大数据分析及其数据来源. 大数据分析:顾名思义,就是对规模巨 ...

  6. 数据分析的数据来源于哪

    数据分析这个话题是老生常谈了,以前的实体公司是发动了人海战 术,从线下各种地方做市场调研.做问卷调查,从这些收集到数据中分析客户需求寻找企业发展的路子. 商业智能数据分析软件 excel做数据分析难以 ...

  7. hive 查询表中的数据来源hdfs 位置

    1\Hive中查看数据来源文件和具体位置方法 select id, dt ,xxx ,INPUT__FILE__NAME,BLOCK__OFFSET__INSIDE__FILE from data_m ...

  8. 注册表故障恢复 必须使用记录或另一备份以恢复包含系统注册表数据的文件。恢复成功...

    刚装好的XP,陆续装了一些软件之后,重启一进入系统就弹出: 注册表故障恢复        必须使用记录或另一备份以恢复包含系统注册表数据的文件.恢复成功 google + baidu 好像都没有合理解 ...

  9. 数据分析-数据来源、字段类型、数据采集陷阱

    数据分析伴随着大数据的发展而兴起,在日常的生活中扮演着越来越重要的作用,今天从"数据的来源.数据类型.数据采集陷阱"开始逐步介绍数据分析方面的知识,其中有些许谬误,还请及时指点. ...

最新文章

  1. 真正的全栈工程师!B站硬核UP主自己造了一个激光雷达
  2. mysql userstat_mysql 中记录用户登录错误日志方法小结
  3. OJ题目细菌实验分组c语言,C语言
  4. Microsoft uaa bus driver for high definition audio
  5. PHP 设计模式之迭代器模式
  6. python下载文件传到服务器_python实现FTP文件传输的方法(服务器端和客户端)
  7. ES6的Set和Map你都知道吗?一文了解集合和字典在前端中的应用
  8. python logger.debug_python处理logger日志
  9. Windows 10 全新界面来了:焕然一新!
  10. 计算机it dt ct基础知识,ot是什么意思,什么是CT,IT,DT,OT
  11. ThinkPad P1 Gen4 是否支持单条4T固态?
  12. EFR32MG裸机工程-2-LED
  13. JDK9对String字符串的新一轮优化,不可不知
  14. python语言的特点-Python语言的特点有哪些?
  15. 多元函数泰勒级数展开_一元及多元函数的泰勒展开式
  16. maven jar包导入失败,Cannot resolve XXXXXXX
  17. Windows 10设备的蓝牙不能连接了怎么办?
  18. 10个免费的响应式布局HTML5+CSS3模板
  19. 永安在线API安全管控平台正式发布,以情报建立API安全基线
  20. zlib.hpp封装

热门文章

  1. 小车自动往返工作原理_自动往返小汽车
  2. 基于Arduino的PS2机械臂遥控小车(L298N)傻瓜教程
  3. 关于阿里巴巴开发手册不得使用外键与级联,一切外键概念必须在应用层解决的疑惑
  4. 递归下降分析法实现强化计算器
  5. websocket 发送数据大于0xFFFF(65535)的处理
  6. 学习篇--FPGA学习网站
  7. API day02 IO流
  8. 360网站卫士php-dos,360doskill.php
  9. Ghidra Java API报NoClassDefFoundError的解决方法
  10. rtx3090显卡什么级别 rtx3090显卡什么水平 3090属于什么档次的显卡