对比分析

概念:两个互相联系的指标进行比较
类型:绝对数比较(相减) 、相对数比较(相除)
其中相对数比较分析也包括:结构分析、比例分析、动态对比分析

1.绝对数比较

a.对比的指标在量级上不能差别过大
b.折线图、柱状图*

#导入数据

data = pd.read_csv('C:\\Users\\zhouchunzhu\\Desktop\\py.test/样例数据02.csv',engine = 'python')
data.head()


(2)折线图比较

data.plot('时间',kind='line',style = '--.',alpha = 0.8,figsize = (10,3),title = '王者峡谷住房供应成交对比-折线图')


(2)多系列柱状图比较

data.plot('时间',kind = 'bar',width = 0.8,alpha = 0.8,figsize = (10,3),title = '王者峡谷住房供应成交对比-柱状图')


(3)堆叠图

fig3 = plt.figure(figsize=(10,6))
plt.subplots_adjust(hspace=0.3)
# 创建子图及间隔设置ax1 = fig3.add_subplot(2,1,1)
x = range(len(data))
y1 = data['住宅新房成交']
y2 = -data['住宅新房供应']
plt.bar(x,y1,width = 1,facecolor = 'yellowgreen')
plt.bar(x,y2,width = 1,facecolor = 'lightskyblue')
plt.title('住宅新房成交供应-堆叠图')
plt.grid()
plt.xticks(range(0,30,6))
ax1.set_xticklabels(data.index[::6])


(4)差值折线图

ax2 = fig3.add_subplot(2,1,2)
y3 = data['住宅新房成交']-data['住宅新房供应']
plt.plot(x,y3,'--go')
plt.axhline(0,color='r',linestyle="--",alpha=0.8)  # 添加y轴参考线
plt.grid()
plt.title('住宅新房成交供应-差值折线')
plt.xticks(range(0,30,6))
ax2.set_xticklabels(data.index[::6])


2.相对数比较

a.有联系的指标综合计算后的对比,数值为相对数
b.结构分析、比例分析、空间比较分析、动态对比分析

#导入数据

# 导入数据 → 上半年内五位销售人员月销售额
data = pd.read_csv('C:\\Users\\zhouchunzhu\\Desktop\\py.test/样例数据(销售数据04).csv',engine = 'python')
data


(1)结构分析
在分组基础上,各组总量指标与总体的总量指标对比,计算出各组数量在总量中所占比重,反映总体的内部结构。

# 计算出每天的营收占比
data['熊大_per'] = data['熊大'] / data['熊大'].sum()
data['牛二_per'] = data['牛二'] / data['牛二'].sum()# 转换为百分数
data['熊大_per%'] = data['熊大_per'].apply(lambda x: '%.2f%%' % (x*100))
data['牛二_per%'] = data['牛二_per'].apply(lambda x: '%.2f%%' % (x*100))
data#画图
fig,axes = plt.subplots(2,1,figsize = (10,6),sharex=True)
#绝对数比较——熊大和牛二上半年前月度销售额
data[['熊大','牛二']].plot(kind='line',style = '--.',alpha = 0.8,ax=axes[0])
axes[0].legend(loc = 'upper right')
#相对数比较——熊大和牛二上半年前月度销售额
data[['熊大_per','牛二_per']].plot(kind='line',style = '--.',alpha = 0.8,ax=axes[1])
axes[1].legend(loc = 'upper right')



(2)比例分析
a.在分组的基础上,将总体不同部分的指标数值进行对比,其相对指标一般称为“比例相对数”;
b.比例相对数 = 总体中某一部分数值 / 总体中另一部分数值 → “性价比指数”、“租售比”、“性价比”“男女比”…

导入数据

data = pd.read_csv('C:\\Users\\zhouchunzhu\\Desktop\\py.test/样例数据(租金售价).csv',engine = 'python')
data.head()


# 售租比→ 售价租金比
data['售租比'] = data['均价'] / data['租金']
data.head()data['售租比'].plot.area(color = 'green',alpha = 0.5,ylim = [100,2000],figsize=(8,3),grid=True)
# 创建面积图表达


*(3)动态对比分析(纵向对比分析)

a.同一现象在不同时间上的指标数值进行对比,反应现象的数量随着时间推移而发展变动的程度及趋势;
b.最基本方法,计算动态相对数 → 发展速度;
c.动态相对数(发展速度) = 某一现象的报告期数值 / 同一现象的基期数值;
d.基期:用来比较的基础时期;
e.报告期:所要研究的时期,又称计算期;*

data = pd.DataFrame({'A':np.random.rand(30)*3000+1000},index = pd.period_range('20200101','20200130'))
print(data.head())
print('------')
# 创建数据 → 30天内A企业的营业收入情况#设定基期水平,假设为1000
data['基期水平'] = 1000#累计增长量
data['累计增长量'] = data['A'] - data['基期水平']#逐期增长量
data['上一期A'] = data.shift(1)['A']                        #ata.shift(1) 数据向后平移
data['逐期增长量'] =  data['A'] - data.shift(1)['A']
data.fillna(0,inplace=True)                                # 替换缺失值
data.head()data[['累计增长量','逐期增长量']].plot(figsize = (10,4),style = '--.',alpha = 0.8,title='A企业30天营业收入增长情况(万)')
plt.axhline(0,color='r',linestyle="--",alpha=0.8)         # 添加y轴参考线
plt.legend(loc = 'lower left')
plt.grid()
# 通过折线图查看增长量情况data['定基增长速度'] = data['累计增长量'] / 1000
data['环比增长速度'] = data['逐期增长量'] / data.shift(1)['A']
data[['定基增长速度','环比增长速度']].plot(figsize = (10,4),style = '--.',alpha = 0.8,title='A企业30天营业收入增长速度')
plt.axhline(0,color='r',linestyle="--",alpha=0.8)  # 添加y轴参考线
plt.grid()
print(data.head())
print('------')



python数据分析之对比分析相关推荐

  1. Python数据分析初学之分析表格

    文章目录 Python数据分析初学之分析表格 任务要求 代码实现 Python数据分析初学之分析表格 任务要求 1)使用 pandas 读取文件 data.csv 中的数据 ,创建 DataFrame ...

  2. 【详解】Python数据分析第三方库分析

    Python数据分析第三方库分析 目录 Python数据分析第三方库分析 @常用库下载地址 1 Numpy 2 Matplotlib 3 Pandas 4 SciPy 5 Scikit-Learn 6 ...

  3. python数据分析的交叉分析和分组分析 -第三次笔记

    python数据分析 -第三次笔记 –1.交叉分析 –2.分组分析 1.交叉分析 交叉分析的含义是在纵向分析法和横向分析法的基础上,从交叉.立体的角度出发,由浅入深.由低级到高级的一种分析方法.这种方 ...

  4. Python数据分析之探索性分析(多因子复合分析)

    目录 一.假设检验: 二.交叉分析 1.分析属性与属性之间关系的方法 2.透视表 三.分组与钻取: 四.相关分析 1.相关系数分析 2.熵:条件熵:互信息(熵增益):增益率:基尼系数: 3.衡量离散数 ...

  5. Python数据分析——基金定投收益率分析,以及支付宝“慧定投”智能定投实现

    文章目录 一.关于基金定投 数据来源 接口规范 常见指数基金/股票代码 二.分析目标 三.代码实现 1.定义获取数据.清洗数据的函数 2.定义定投策略函数 3.计算2019年对沪深300指数基金进行定 ...

  6. python数据比例_#python# #数据分析# 性别比例分析

    手头有一份性别比例的样本数据,清洗后只保留了性别信息,做了一个数据分析. 数据清洗和数据统计的代码就不贴了,贴性别比例pie图和性别比例趋势图的代码. 性别比例pie图: def _plot_gend ...

  7. Python数据分析之股票分析

    股票分析 使用tushare包获取某股票的历史行情数据 输出该股票所有收盘比开盘上涨3%以上的日期 输出该股票所有开盘比前日收盘跌幅超过2%的日期 假如从2010年1月1日开始,每月第一个交易日买入1 ...

  8. Python数据分析项目:分析世界五百强企业数据

    前言 嗨喽!大家好,这里是魔王~ 哪个国家的世界五百强企业数量最多? 今天带你用python来处理数据,并实现数据可视化,解决对现有数据产生的疑问. 本次代码是在 Jupyter Notebook 里 ...

  9. python数据分析练习——姓名分析US_Baby_names_right.csv

    第一步:导入相关模块 import pandas as pd from pandas import Series,DataFrame import matplotlib.pyplot as plt p ...

最新文章

  1. 全球第五大社交网站,二号员工离职创业,自爆心酸历程!想做10亿美元规模?先活着!...
  2. 抖音日活用户破 6 亿,推荐系统到底有何魔力?
  3. JS中的call和apply
  4. 解决phpmyadmin 遇见的问题
  5. VC++初步实现保存数据为音频WAV文件
  6. C++判断一个数字是否是某个数字的阶乘(附完整源码)
  7. 搜索引擎提交注意事项
  8. CRM WebUI and Hybris的Product页面标题实现
  9. 计算机机房t4,机房等级-T2-T3-T4-如何划分
  10. 4016-二叉排序树的判定(C++,附思路)
  11. 在VS2005下搭建和使用CppUnit
  12. 手动下载股票列表 存入mongodb 并更新名字
  13. Spark配置启动脚本分析
  14. ios开发闹钟步骤_苹果快捷指令自动化(起床关闹钟后自动播放音乐)
  15. Hue使用之Inceptor篇
  16. 24点算法讲解与实现
  17. Oracle 11g详细安装介绍plsql下载和安装介绍
  18. 下面程序段中带下划线的语句的执行次数的数量级是( )
  19. 使用redis的setnx可以非同一线程进行加锁和解锁(附源码)
  20. java的副语言_英语副语言的交际功能及特征

热门文章

  1. SaaS的矛盾与困境
  2. java onetomany_spring-data-jpa ----OneToMany 一对多
  3. 用Echarts绘制折线图-----堆积面积图和堆积折线图
  4. Android自定义View 闹钟唤起播放闹钟铃声实现
  5. 一张非常有创意的图片
  6. 数学之英文写作——基本中英文词汇(几何与三角的常用词汇)
  7. attempted relative import with no known parent package,已解决
  8. iOS面试题·自整理·One
  9. 用CSS3实现惊艳面试官的背景及背景动画(建议收藏)
  10. java计算机毕业设计高校游泳馆信息管理MyBatis+系统+LW文档+源码+调试部署