案例13-2 销售人员的报酬

假设大旧金山地区一个销售专业人员的地方分会对该组织的成员进行一项调查,其目的是:对受雇的销售人员,无论销售场所是在室内还是在户外,如果他们的资历与年薪之间存在某种关系的话,则对这种关系进行研究。在调查中,受访者要求在三种资历水平中指定其中的一种:低(1~10年),中(11~20)年和高(21或21年以上)。调查所得数据的一部分如下所示。

导入模块与数据

import pandas as pd

import numpy as np

import warnings

warnings.filterwarnings("ignore")

#单因素方差分析模块

from scipy.stats import f_oneway

#多因素方差分析模块

from scipy import stats

from statsmodels.formula.api import ols

from statsmodels.stats.anova import anova_lm

#画图函数

import matplotlib.pyplot as plt

import seaborn as sns

%matplotlib inline

data = pd.read_csv('SalesSalary.csv')

data.head()

1.使用描述统计学汇总这些数据

①销售场所分布

plt.subplots(figsize=(6,6))

sns.countplot('Position',data=data,palette='inferno',edgecolor=sns.color_palette('dark',7))

plt.xticks(rotation=90)

plt.title('Number Of Position')

plt.show()

销售场所为室内的人数和户外的人数相等,均为60人

②销售人员经验分布

plt.subplots(figsize=(6,6))

sns.countplot('Experience', data=data, palette='inferno', edgecolor=sns.color_palette('dark',7))

plt.xticks(rotation=90)

plt.title('Number Of Experience')

plt.show()

工作资历低、中、高的人数相等,均为40人

③销售人员收入分布

sns.distplot(data['Salary'], kde=True, rug=True);

大部分员工的薪资水平集中在50000~65000美元

data_2 = data.groupby(by=["Position", "Experience"])["Salary"].describe()

data_2

plt.subplots(figsize=(8,6))

sns.boxplot(x="Position", y="Salary", hue="Experience",data=data, palette="Set2")

户外销售的均值、最大值、最小值、数据分布皆大于室内销售,且室外经验为中的销售员工资最高。

2.不考虑销售人员的工作资历和工作场所,建立一个95%的销售人员平均年薪的置信区间估计。

confidence=0.95

sample_mean = np.mean(data["Salary"])

sample_std = np.std(data["Salary"])

sample_size = len(data["Salary"])

alpha = 1 - 0.95

t_score = stats.t.isf(alpha / 2, df = (sample_size-1) )

ME = t_score * sample_std / np.sqrt(sample_size)

lower_limit = sample_mean - ME

upper_limit = sample_mean + ME

print( str(confidence*100)+ '%% Confidence Interval: ( %.2f, %.2f)' % (lower_limit, upper_limit))

95.0% Confidence Interval: ( 62974.48, 66876.47)

3.建立一个95%的室内销售人员平均年薪的置信区间估计

confidence=0.95

sample_mean = np.mean(data[data['Position']=="Inside"]["Salary"])

sample_std = np.std(data[data['Position']=="Inside"]["Salary"])

sample_size = len(data[data['Position']=="Inside"]["Salary"])

alpha = 1 - 0.95

t_score = stats.t.isf(alpha / 2, df = (sample_size-1) )

ME = t_score * sample_std / np.sqrt(sample_size)

lower_limit = sample_mean - ME

upper_limit = sample_mean + ME

print( str(confidence*100)+ '%% Confidence Interval: ( %.2f, %.2f)' % (lower_limit, upper_limit))

95.0% Confidence Interval: ( 55100.93, 56940.11)

4.建立一个95%的户外销售人员平均年薪的置信区间估计

confidence=0.95

sample_mean = np.mean(data[data['Position']=="Outside"]["Salary"])

sample_std = np.std(data[data['Position']=="Outside"]["Salary"])

sample_size = len(data[data['Position']=="Outside"]["Salary"])

alpha = 1 - 0.95

t_score = stats.t.isf(alpha / 2, df = (sample_size-1) )

ME = t_score * sample_std / np.sqrt(sample_size)

lower_limit = sample_mean - ME

upper_limit = sample_mean + ME

print( str(confidence*100)+ '%% Confidence Interval: ( %.2f, %.2f)' % (lower_limit, upper_limit))

95.0% Confidence Interval: ( 71800.84, 75860.02)

5.在α=0.05的显著性水平下,并且暂时不考虑销售人员工作资历的影响,利用方差分析方法,检验销售人员工作场所的显著差异。

a = data[data['Position']=="Outside"]["Salary"]

b = data[data['Position']=="Inside"]["Salary"]

f,p = f_oneway(a,b)

print (f)

print (p)

251.540435527

4.96485601468e-31

不同工作场所的销售人员收入具有显著性差异

6.在α=0.05的显著性水平下,并且暂时不考虑销售人员工作场所的影响,利用方差分析方法,检验销售人员工作资历的显著差异。

a = data[data['Experience']=="High"]["Salary"]

b = data[data['Experience']=="Low"]["Salary"]

c = data[data['Experience']=="Medium"]["Salary"]

f,p = f_oneway(a,b,c)

print (f)

print (p)

7.92614411145

0.000591267665676

不同工作资历的销售人员收入具有显著性差异

7.在α=0.05的显著性水平下,检验销售人员工作场所、工作资历和交互作用的显著差异。

符号意义:(~)隔离因变量和自变量 (左边因变量,右边自变量 )

(+)分隔各个自变量

(:)表示两个自变量交互影响

#进行这个分析的时候,pandas版本要降到0.19.2

ExperienceLevelDict = {'High':3,'Medium':2,'Low':1}

PositionDict = {'Inside':1,'Outside':0}

data['Experience_1'] = data['Experience'].map(ExperienceLevelDict)

data['Position_1'] = data['Position'].map(PositionDict)

formula = 'Salary~Experience_1+Position_1+Position_1:Experience_1'

model = ols(formula,data).fit()

results = anova_lm(model)

results

销售人员工作场所,工作资历和交互作用皆具有显著差异

python经济统计_Python商务与经济统计学-方差分析相关推荐

  1. .net bitmap rgb数据_Python商务与经济统计学-数据描述

    案例2-1.3-1 Pelican 商店 本案例之中主要涉及到Pandas和pyecharts的一些功能,比如利用pandas进行数据筛选,百分比频数统计,将数据进行分组,分组统计,相关性分析等.另外 ...

  2. python书籍_python书籍购买建议

    前面我们推文中介绍了<R语言书籍购买建议>,这次内容我们介绍一下python数据分析书籍购买建议.这里只是我对购买过的书籍自己的一些见解,并不是直播带货,因为这里还有许多我不推荐购买的,要 ...

  3. python画代码-Python教程_Python画Mandelbrot集 代码

    Python教程_Python画Mandelbrot集 代码 作者:Comet 来源: 课课家 www.kokojia.com点击数:278发布时间:2015-06-19 11:17:19 曼德勃罗集 ...

  4. 经济统计学专业学C语言,2019经济统计学专业怎么样、学什么、前景好吗

    经济统计学是统计学在经济领域中的应用,是以经济数据为研究对象,包括经济数据的采集,以及用统计方法分析经济数据背后的经济现象以及复杂经济系统的规律,从而为经济和管理决策服务.下面是学习啦小编给大家带来的 ...

  5. c语言实现爬虫功能,用C/C 扩展Python语言_python 调用c语言 python实现简单爬虫功能_python实现简单爬虫...

    用C/C 扩展Python语言 Python是一门功能强大的脚本语言,它的强大不仅表现在功能上,还表现在其扩展性上.她提供大量的API以方便程序员利用C/C++对Python进行扩展.因为执行速度慢几 ...

  6. python编程语言_python编程语言的简要历史

    python编程语言 The Python programming language is a general-purpose programming language that has carved ...

  7. 2019最新Python学习教程(Python视频教程_Python学习教程_Python学习路线):你心目中编程界的MVP是谁?

    2019最新Python学习教程(Python视频教程_Python学习教程_Python学习路线):你心目中编程界的MVP是谁?编程界的王者是渐落寞的Java还是大火的Python? 是不是你们也喜 ...

  8. python 计量经济 35岁 工作_Python在计量经济与统计学中的应用

    Python for Econometrics and Statistics (Python在计量经济与统计学中的应用) [点击链接进入主页].这套笔记将重点介绍Python在计量经济学与统计分析中的 ...

  9. python在统计专业的应用_Python在计量经济与统计学中的应用

    Python for Econometrics and Statistics (Python在计量经济与统计学中的应用) [点击链接进入主页].这套笔记将重点介绍Python在计量经济学与统计分析中的 ...

  10. python 计算订单量最多的店铺订货金额_Python数据分析实例-统计学在解决奶茶店问题中的应用...

    作为数据分析师,除了熟练各种分析工具外,更重要的是分析.解决问题的能力以及扎实的数学功底,尤其是统计学. 本文将用一个例子,一步一步展示1)分析问题的步骤,2)更具需求选择合适工具和数据获取,3)和统 ...

最新文章

  1. 模式的学习笔记----转摘自把爱好作为自己工作的人
  2. 西门子Step7找不到有效授权的解决方法
  3. 2019编译ffepeg vs_2020/5-Win10下ffmpeg最简编译方法
  4. P3830-[SHOI2012]随机树【数学期望,dp】
  5. 全是宝!20款优质高效的在线协作工具任你挑,就是这么强大!
  6. oracle数据库plsqldev导出表、表结构的方法
  7. 台式计算机硬盘序号,[硬盘序列号的查看方法]台式机查看序列号的方法
  8. 跨语言词嵌入模型调研报告
  9. Linux内核时间管理和定时器
  10. APP项目完整工作流程
  11. 要在一个领域取得成就,就必须有对该领域的独特的执着
  12. 阿里云Linux服务器如何安装ClamAV杀毒软件-最全详细教程
  13. 一文说明白ECDSA spec256k1 spec256r1 EdDSA ed25519千丝万缕的关系
  14. Git冲突与解决方法
  15. HTML怎么给文本添加删除线?(代码教程)
  16. ByVal和ByRef的区别
  17. Springboot母婴店购物系统9j5v8计算机毕业设计-课程设计-期末作业-毕设程序代做
  18. 科大讯飞离线语音命令词识别的使用说明
  19. 【Hadoop】P2 Hadoop简介
  20. 指令集创始人潘爱民博士荣获CSDN“2021年度IT领军人物”

热门文章

  1. 高项_第一章信息化和信息系统
  2. Spring5,最全教程,带你认识IOC容器和AOP切面
  3. 微信小程序 - 方法
  4. Visio Professional 2019 激活方法详解
  5. pycharm免安装版推荐
  6. Android Dex文件详解
  7. 安卓中将Java文件转换成Dex文件
  8. 安装系统user服务器登录失败,win10系统开机提示user profile service服务器登录失败的解决方法...
  9. java手机连点脚本_自动连点器app下载 自动连点器(屏幕点击器) for Android v1.0 安卓版 下载-脚本之家...
  10. 企业微信的好处和功能介绍 | 最新企业微信电脑版下载