python数据分析与挖掘实战(2)帕累托法则菜品盈利分析与相关性分析
表格样式
菜品数据特征提取
from __future__ import print_function
import pandas as pdcatering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列
data = data[(data[u'销量'] > 400)&(data[u'销量'] < 5000)] #过滤异常数据
statistics = data.describe() #保存基本统计量statistics.loc['range'] = statistics.loc['max']-statistics.loc['min'] #极差
statistics.loc['var'] = statistics.loc['std']/statistics.loc['mean'] #变异系数
statistics.loc['dis'] = statistics.loc['75%']-statistics.loc['25%'] #四分位数间距print(statistics)
菜品盈利数据 帕累托图
#-*- coding: utf-8 -*-
#
from __future__ import print_function
import pandas as pd#初始化参数
dish_profit = '../data/catering_dish_profit.xls' #餐饮菜品盈利数据
data = pd.read_excel(dish_profit, index_col = u'菜品名')
data = data[u'盈利'].copy()
data.sort_values(ascending = False)
#降序排列
import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号plt.figure()
data.plot(kind='bar')
plt.ylabel(u'盈利(元)')#左侧y轴,右侧y轴
p = 1.0*data.cumsum()/data.sum()
p.plot(color = 'r', secondary_y = True, style = '-o',linewidth = 2)
plt.annotate(format(p[6], '.4%'), xy = (6, p[6]), xytext=(6*0.9, p[6]*0.9), arrowprops=dict(arrowstyle="->", connectionstyle="arc3,rad=.2")) #添加注释,即85%处的标记。这里包括了指定箭头样式。
#注释格式规定,点的位置,注释内容,箭头样式
plt.ylabel(u'盈利(比例)')
plt.show()
相关性分析
```cpp
from __future__ import print_function
import pandas as pdcatering_sale = '../data/catering_sale_all.xls' #餐饮数据,含有其他属性
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列data.corr() #相关系数矩阵,即给出了任意两款菜式之间的相关系数
data.corr()[u'百合酱蒸凤爪'] #只显示“百合酱蒸凤爪”与其他菜式的相关系数
data[u'百合酱蒸凤爪'].corr(data[u'翡翠蒸香茜饺']) #计算“百合酱蒸凤爪”与“翡翠蒸香茜饺”的相关系数
python数据分析与挖掘实战(2)帕累托法则菜品盈利分析与相关性分析相关推荐
- 《Python数据分析与挖掘实战》第15章 ——电商产品评论数据情感分析(LED)
文章目录 1.挖掘背景与目标 2.2 数据探索与预处理 2.1 数据筛选 2.2 数据去重 2.3 删除前缀评分 2.4 jieba分词 3 基于LDA 模型的主题分析 4.权重 5.如何在主题空间比 ...
- 《Python数据分析与挖掘实战》一3.1 数据质量分析
本节书摘来自华章出版社<Python数据分析与挖掘实战>一书中的第3章,第3.1节,作者 张良均 王路 谭立云 苏剑林,更多章节内容可以访问云栖社区"华章计算机"公众号 ...
- 《Python数据分析与挖掘实战》一第1章 数据挖掘基础1.1 某知名连锁餐饮企业的困惑...
本节书摘来自华章出版社<Python数据分析与挖掘实战>一书中的第1章,第1.1节,作者 张良均 王路 谭立云 苏剑林,更多章节内容可以访问云栖社区"华章计算机"公众号 ...
- 《Python数据分析与挖掘实战》一1.2 从餐饮服务到数据挖掘
本节书摘来自华章出版社<Python数据分析与挖掘实战>一书中的第1章,第1.2节,作者 张良均 王路 谭立云 苏剑林,更多章节内容可以访问云栖社区"华章计算机"公众号 ...
- 《Python数据分析与挖掘实战》第7章-聚类+绘制雷达图
本文是基于<Python数据分析与挖掘实战>的第七章的数据--<航空公司客户价值分析>做的分析对部分代码,做出补充,对原文中的雷达图进行了实现. 1. 背景与目标分析 此项目旨 ...
- (八)Python数据分析与挖掘实战(实战篇)——中医证型关联规则挖掘
这个专栏用来记录我在学习和实践<Python数据分析与挖掘实战>一书时的一些知识点总结和代码实现. 文章目录 背景和目标 数据 原始属性表 脚本 discretization.py apr ...
- 《Python数据分析与挖掘实战》第8章——中医证型关联规则挖掘(Apriori关联)
本文是基于<Python数据分析与挖掘实战>的实战部分的第八章的数据--<中医证型关联规则挖掘>做的分析. 旨在补充原文中的细节代码,并给出文中涉及到的内容的完整代码. 主要有 ...
- 《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记
最近在学习<Python数据分析与挖掘实战>中的案例,写写自己的心得. 代码分为两大部分:1.读取数据并进行聚类分析 2. ...
- 《Python数据分析与挖掘实战》示例源码免费下载
<Python数据分析与挖掘实战> 在当今大数据驱动的时代,要想从事机器学习.人工智能.数据挖掘等前沿技术,离不开数据跟踪与分析,通过NumPy.Pandas等进行数据科学计算,通过Se ...
- Python数据分析与挖掘实战期末考复习(抱佛脚啦)
期末三天赛高考我真的会谢,三天学完数据挖掘--真的很极限了的. 课本是那本绿色的Python数据分析与挖掘实战(第2版),作者张良均- 图片来自老师给的ppt,以下内容是我自己总结的,自己复习用,覆盖 ...
最新文章
- debian/ubuntu下安装java8
- linux 全局搜索文件_Linux笔记之文件搜索1
- java gridlayout 设置列宽_java 利用GridBagLayout布局时,如何设置单列列宽?
- python基础===PEP网站,代码规范指南
- 【Java】模拟分组交换网络的时延、丢包
- cookie知识总结
- tomcat 发布到服务器启动不了
- python金融网课_Python金融数据分析
- 淘宝镜像(浏览器驱动等等等)
- 正则方程(机器学习)
- 自己开发的一套实用故障报修管理系统【分享推荐大家】
- 【源码阅读 | 03】only-allow 统一规范团队包管理器
- biosrecovery什么意思_卡刷和线刷手机什么意思 Recovery使用方法
- SaltStack配置管理
- 怎么停止skywalking_SkyWalking安装和使用
- 无需编程,DIY自己智能小车的Android蓝牙遥控软件(一)
- Attention-GAN
- 申请阿里云的免费SSL证书,实现小程序HTTPS请求
- 品Spring:详细解说bean后处理器
- 【华人学者风采】汪建军 华北电力大学
热门文章
- 无刷直流电机与永磁同步电机比较
- 导出Excel:合并单元格
- 山大计算机学院夏令营2021,关于举办山东大学2021年暑期未来数学家夏令营的通知...
- Scrum Or Kanban: 选择属于自己的敏捷管理框架
- Added a key not lexically larger than previous.
- shell 多个引号冲突_Shell 引号嵌套
- 我要悄悄学习,做一个浪漫的程序员
- 富文本编辑器tinymce支持从word复制粘贴保留格式和图片的插件wordpaster
- 二级路由器设置为何要关闭DHCP服务
- 一周信创舆情观察(2.14~2.20)