人力资源数据分析(包含数据来源文件)
数据源
百度网盘:
链接:https://pan.baidu.com/s/1EKxDdJDNqhqzucK6eH0Rew?pwd=1234
提取码:1234
数据字段及解释
导入数据
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
data = pd.read_csv('C:\\Users\\86199\\Desktop\\HR_comma_sep.csv')
data.head()
在职情况分析
left_rate=data.left.value_counts()/14999
left_rate
数据中不同薪水占比
不同薪水占比 = data.salary.value_counts()/ 14999
不同薪水占比
查看工作类型以及其与工资,工作时长的关系
data.sales.unique() #工作类型
data1 = data.groupby(['salary','sales'])['average_montly_hours'].mean().unstack(0)
%matplotlib inline
data1.plot.bar(rot = 60) #以柱状图的形式展现工资,工作类别和月工时之间的关系
#发现IT类工作,工资越高反而工作时长越低
查看工作类型以及其与工资,工作满意度的关系
data1 = data.groupby(['salary','sales'])['satisfaction_level'].mean().unstack(0).plot(rot = 60)
相关性分析
data['sales'].replace(list(pd.Series(data['sales']).unique()),np.arange(10),inplace=True) #把非数值数据转化成数值数据
data['salary'].replace(list(pd.Series(data['salary']).unique()),[0,1,2],inplace=True)
##把left列移到表的前面,方便分析
front=data['left']
data.drop(labels='left',axis=1,inplace=True)
data.insert(0,'left',front)
data.head()
data.corr()
sns.heatmap(data.corr())
项目数量与是否离职的关系
ax = sns.countplot(x="number_project", hue="left", data=data)
#当项目数量为2,6,7时, 员工更容易离职。
#项目数量为7 的员工全部离职
人力资源数据分析(包含数据来源文件)相关推荐
- 解读:大数据分析及其数据来源
当我们谈到大数据分析,首先需要确定数据分析的方向和拟解决的问题,然后才能确定需要的数据和分析范围.大数据驱动的分析主要的挑战不是技术问题,而是方向和组织领导的问题,要确定方向,提出问题,需要对行业做深 ...
- 大数据分析的“数据来源”有哪些?
当我们谈到大数据分析,首先需要确定数据分析的方向和拟解决的问题,然后才能确定需要的数据和分析范围.大数据驱动的分析主要的挑战不是技术问题,而是方向和组织领导的问题,要确定方向,提出问题,需要对行业做深 ...
- Airbnb数据分析(数据来源:kaggle)
使用工具:sql.Tableau 一.分析背景 Airbnb介绍:Airbnb是AirBed and Breakfast ("Air-b-n-b")的缩写,是一家联系旅游人士和家有 ...
- 数据分析的数据来源都有哪些?
数据的获取方式: 1.获取外部的公开数据集, UCI 加州大学欧文分校开放的经典数据集,被很多数据挖掘实验室采用 http://archive.ics.uci.edu/ml/datasets.ht ...
- 大数据分析数据来源的有哪些类型
在数据量巨大的今天,如何以更高的效率获取分析所需的数据,以及如何利用这些数据反映最真实的情况,是业界不断讨论的话题.接下来,就带大家来了解下大数据分析及其数据来源. 大数据分析:顾名思义,就是对规模巨 ...
- 数据分析的数据来源于哪
数据分析这个话题是老生常谈了,以前的实体公司是发动了人海战 术,从线下各种地方做市场调研.做问卷调查,从这些收集到数据中分析客户需求寻找企业发展的路子. 商业智能数据分析软件 excel做数据分析难以 ...
- hive 查询表中的数据来源hdfs 位置
1\Hive中查看数据来源文件和具体位置方法 select id, dt ,xxx ,INPUT__FILE__NAME,BLOCK__OFFSET__INSIDE__FILE from data_m ...
- 注册表故障恢复 必须使用记录或另一备份以恢复包含系统注册表数据的文件。恢复成功...
刚装好的XP,陆续装了一些软件之后,重启一进入系统就弹出: 注册表故障恢复 必须使用记录或另一备份以恢复包含系统注册表数据的文件.恢复成功 google + baidu 好像都没有合理解 ...
- 数据分析-数据来源、字段类型、数据采集陷阱
数据分析伴随着大数据的发展而兴起,在日常的生活中扮演着越来越重要的作用,今天从"数据的来源.数据类型.数据采集陷阱"开始逐步介绍数据分析方面的知识,其中有些许谬误,还请及时指点. ...
最新文章
- 真正的全栈工程师!B站硬核UP主自己造了一个激光雷达
- mysql userstat_mysql 中记录用户登录错误日志方法小结
- OJ题目细菌实验分组c语言,C语言
- Microsoft uaa bus driver for high definition audio
- PHP 设计模式之迭代器模式
- python下载文件传到服务器_python实现FTP文件传输的方法(服务器端和客户端)
- ES6的Set和Map你都知道吗?一文了解集合和字典在前端中的应用
- python logger.debug_python处理logger日志
- Windows 10 全新界面来了:焕然一新!
- 计算机it dt ct基础知识,ot是什么意思,什么是CT,IT,DT,OT
- ThinkPad P1 Gen4 是否支持单条4T固态?
- EFR32MG裸机工程-2-LED
- JDK9对String字符串的新一轮优化,不可不知
- python语言的特点-Python语言的特点有哪些?
- 多元函数泰勒级数展开_一元及多元函数的泰勒展开式
- maven jar包导入失败,Cannot resolve XXXXXXX
- Windows 10设备的蓝牙不能连接了怎么办?
- 10个免费的响应式布局HTML5+CSS3模板
- 永安在线API安全管控平台正式发布,以情报建立API安全基线
- zlib.hpp封装