使用python集合进行EXCEL数据分析

标准库

Python真正精彩的方面之一是它具有非常丰富的模块标准库 ,无需安装第三方模块即可进行一些复杂的编程。 如果您在系统上有效安装了python,则可以使用所有这些工具。

集合

图片.png

此图显示了两类人:工程师和经理。 两组的交集是工程管理。

>>> engineers = set(['John', 'Jane', 'Jack', 'Janice'])

>>> managers = set(['Jane', 'Jack', 'Susan', 'Zack'])

>>> engineering_management = engineers & managers

>>> engineering_management

{'Jack', 'Jane'}

更复杂的问题

图片.png

假设您是一家公司的分析师并且非常精通Excel。 您知道如何编写公式,可以创建数据透视表等以进行出色的演示。

一天遇到公司销售的大量数据:该数据集大约有1000行,并显示了一段时间内贵公司的所有销售数据。 营销部门有兴趣了解客户的购买方式。 您有兴趣回答以下问题:

有多少顾客购买了鞋子?

有多少客户购买了皮带?

谁购买了鞋子但没有购买皮带?

哪些客户购买了鞋子,皮带和衬衫?

通常,您将开始在Excel中对数据进行排序和管理。 使用Excel的数据过滤器当然很简单,但是当您想要获得唯一的客户列表时,它们就会变得更具挑战性。 由于客户在一段时间内进行了多次购买,因此您必须对数据进行分类/数据透视,并执行其他过滤步骤。 假设您有生成报告和获取数据的方法,那么下次能否轻松重复? 您将如何向同事展示如何做?

使用Python解决问题

图片.png

# -*- coding: utf-8 -*-

# Author: dingtalk or wechat:pythontesting supoort q group 630011153 144081101

# https://www.jianshu.com/u/69f40328d4f0

# https://github.com/china-testing/python-api-tesing

# https://china-testing.github.io/

import csv

f = open("sample-sales.csv",'rt')

reader = csv.reader(f)

shoes = set()

belts = set()

shirts = set()

for row in reader:

customer = (row[0],row[1])

category = row[3]

if category == "Shoes":

shoes.add(customer)

if category == "Belt":

belts.add(customer)

if category == "Shirt":

shirts.add(customer)

f.close()

print("%s customers have purchased shoes" % len(shoes))

print("%s customers have purchased belts" % len(belts))

print("%s customers have purchased shoes but not belts" % len(shoes - belts))

print("%s customers have purchased shoes and belts" % len(shoes & belts))

print("%s customers have purchases shoes and shirts" % len(shoes & shirts))

print("%s customers have purchased shoes, belts and shirts" % len(shoes & belts & shirts))

print("The following customers are our most valued. They have purchased shoes & belts & shirts:")

for customer in shoes & belts & shirts:

print(customer)

该脚本比Excel解决方案更好的原因有很多:

有用于创建文件的记录。 下次您需要运行此分析时,只需运行脚本即可。

将其交给其他人为您运行。 无需做详细的文档来描述Excel中的步骤。

如果数据随时间变化,并且您需要清理它,那么您将有一个良好的开端。

解决方案可以扩展到很大的文件。 在成千上万的行上运行脚本不是问题。 我在一台非常低端的笔记本电脑上用不到20秒就在一个1M的行文件上运行了它。

我希望这可以帮助您了解Python在业务环境中为您提供的强大功能。 这个非常简单的示例开始向您展示您的业务环境中使用Python的潜力。

用python处理excel 数据分析_使用python集合进行EXCEL数据分析相关推荐

  1. 用python分析excel数据_用 python 做数据分析:pandas 的 excel 应用初探

    大毛 岂安科技业务风险分析师 多年订单业务反欺诈经验,负责岂安科技多款产品运营工作. 上回笔者分享过一些 pandas 的常用数据查询语法,但是数据查询对于 pandas 而言只是冰山一角,它还有着更 ...

  2. 成都python数据分析师职业技能_数据分析师需要什么技能,数据分析行业都有什么职业?...

    就目前而言,很多人看到了数据分析行业的光明前景,于是就想进入数据分析的行业中,但是,想成为一名合格的数据分析师,需要掌握很多的技能,那么一名合格的数据分析师需要掌握哪些技能呢?现在的数据分析行业中有数 ...

  3. python多维数据分析_使用python进行数据分析

    Life is short, I use python! 1 python中常用的数据分析包 2 python:一维数据分析 2.1 用numpy包进行一维数据分析 import numpy as n ...

  4. python股票数据分析_用Python浅析股票数据

    本文将使用Python来可视化股票数据,比如绘制K线图,并且探究各项指标的含义和关系,最后使用移动平均线方法初探投资策略. 数据导入 这里将股票数据存储在stockData.txt文本文件中,我们使用 ...

  5. python学后总结_学员 | 斥巨资学完数据分析后,给大家总结了7个小建议

    原标题:学员 | 斥巨资学完数据分析后,给大家总结了7个小建议 写在前面 各位小灶er,大家好,我是人见人爱还会卖课的coco姐,数据分析课程上线大半年了,很多同学还在观望:这个课程是否适合自己呢?非 ...

  6. python足球大数据分析_使用Python抓取欧洲足球联赛数据进行大数据分析

    背景 Web Scraping 在大数据时代,一切都要用数据来说话,大数据处理的过程一般需要经过以下的几个步骤 数据的采集和获取 数据的清洗,抽取,变形和装载 数据的分析,探索和预测 数据的展现 其中 ...

  7. python分组统计标准化_分组计算和汇总_Python数据分析实战应用_数据挖掘与分析视频-51CTO学院...

    为什么学Python: 重要:数据分析是职业技能必备,Python是大数据分析** 趋势:Python是目前非常火的编程语言,使用人多 好学:学习简单,容易上手,使用灵活,可扩展强 **:会Pytho ...

  8. 业余学python数据挖掘怎么赚钱_如何在业余时学数据分析?

    反对高票答案. 一上来便是各种教程,二话不说给出一批书单,各种数据处理的方式,讲怎么样用Python挖掘数据,怎么用R进行数据可视化,讲AB测试. 他们给的教程都很好,数据处理的方式也很有借鉴意义. ...

  9. python读取第二行_使用Python操作Excel(二):读取数据表

    上一节我们提到,使用openpyxl可以方便的对数据表进行操作,例如:抽象Excel数据并存入数据库 将数据库数据导出到Excel 给一个已存在的数据表追加信息 我们还介绍了一些Excel的基本术语, ...

最新文章

  1. 强化学习,路在何方?
  2. caffe finetune predict and classify the lung nodule( 肺结节的分类)
  3. Oracle数据库中序列(SEQUENCE)的用法详解
  4. openwrt上wifi探针的实现
  5. jQuery源码的基础知识
  6. Linux的实际操作:关机shutdown、重启reboot、用户注销logout
  7. JavaScript DOM扩展——“选择符API和元素遍历”的注意要点
  8. oracle 字符格式化,Oracle 字段格式化[日期,金额]
  9. 9600波特率每秒传送多少字节_arduino传送字符串json到python解析为字典数据
  10. Eclipse卸载插件SpringSoource-tool-suite
  11. 天思经理人ERP日化行业应用方案
  12. Python爬虫——用Pycharm写一个爬虫程序,爬取糗图百科全部糗图,室友看了直呼牛逼
  13. 杭州计算机学校课程表,超级课程表电脑版
  14. 区块链技术与应用(北大公开课,肖臻)- 课程总结
  15. 高级辅助驾驶(ADAS)整理(炒鸡详细)
  16. bzoj 3039 玉蟾宫 单调栈
  17. 鸿蒙app学习笔记一
  18. 蘑菇街2021财年Q1财报:直播GMV连续18个季度保持增长
  19. F429/439 SDRAM is42s16-8Mbyte
  20. 地图网站,二三维地图

热门文章

  1. Android开机动画制作
  2. Windows安装dig命令
  3. C#(仿QQ)聊天窗口
  4. MySQL之——查询重复记录、删除重复记录方法大全
  5. 记Stream的toMap方法引发的问题
  6. Java IO 字节流、字符流详解
  7. python 调试过程中的小问题
  8. linux 如何进入bios设置密码,装了linux无法进入bios设置密码
  9. flask引用bootstrap4框架
  10. 关于Onehot编码的总结