需求背景:公司和外包公司进行结算,需要对每天的作业量进行统计。作业量分为进出口量,进口量分为天津市区进口量、全国进口量以及其他。出口量类似。常规的方法是使用excel进行筛选。但人工筛选存在两个问题,大量的表格会耗费很多时间和精力,人工筛选也会出现一些纰漏。

代码如下:出口测试

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime
from pandas import Series, DataFrame
df = pd.read_excel('data/17out.xls')
df1=df.loc[(df["邮路"]=="WS30005000") | (df["邮路"] == "二枢纽-速处") | (df["邮路"] == "WS30006000")| (df["邮路"] == "WS30008100")| (df["邮路"] == "WS30004000")].数量.sum()df2 = df.loc[(df["邮路"]=="市内一次1路") | (df["邮路"] == "市内一次2路") | (df["邮路"] == "市内一次3路")| (df["邮路"] == "市内一次4路")| (df["邮路"] == "市内一次5路")| (df["邮路"] == "市内一次6路")
| (df["邮路"] == "市内一次7路")| (df["邮路"] == "市内一次8路")| (df["邮路"] == "市内一次9路")
| (df["邮路"] == "市内一次10路")| (df["邮路"] == "市内一次11路")| (df["邮路"] == "市内一次12路")
| (df["邮路"] == "市内一次13路")
| (df["邮路"] == "市内二次1路")| (df["邮路"] == "市内二次2路")| (df["邮路"] == "市内二次3路")
| (df["邮路"] == "市内二次4路")| (df["邮路"] == "市内二次5路")| (df["邮路"] == "市内二次6路")
| (df["邮路"] == "市内二次7路")| (df["邮路"] == "市内二次8路")| (df["邮路"] == "市内二次9路")
| (df["邮路"] == "市内二次10路")| (df["邮路"] == "市内二次11路")| (df["邮路"] == "市内二次12路")
| (df["邮路"] == "市内二次13路")
| (df["邮路"] == "市内三次1路")| (df["邮路"] == "市内三次2路")| (df["邮路"] == "市内三次3路")
| (df["邮路"] == "市内三次4路")| (df["邮路"] == "市内三次5路")| (df["邮路"] == "市内三次6路")
| (df["邮路"] == "市内三次7路")| (df["邮路"] == "市内三次8路")| (df["邮路"] == "市内三次9路")
| (df["邮路"] == "市内三次10路")| (df["邮路"] == "市内三次11路")| (df["邮路"] == "市内三次12路")
| (df["邮路"] == "市内三次13路")
| (df["邮路"] == "市内四次1路")| (df["邮路"] == "市内四次2路")| (df["邮路"] == "市内四次3路")
| (df["邮路"] == "市内四次4路")| (df["邮路"] == "市内四次5路")| (df["邮路"] == "市内四次6路")
| (df["邮路"] == "市内四次7路")| (df["邮路"] == "市内四次8路")| (df["邮路"] == "市内四次9路")
| (df["邮路"] == "市内四次10路")| (df["邮路"] == "市内四次11路")| (df["邮路"] == "市内四次12路")
| (df["邮路"] == "市内四次13路")].数量.sum()
df3 = df.loc[(df["邮路"] == "天津-津南1频")| (df["邮路"] == "天津-津南2频")
| (df["邮路"] == "天津-北辰1频")| (df["邮路"] == "天津-北辰2频")
| (df["邮路"] == "天津-塘沽一路1频")| (df["邮路"] == "天津-塘沽一路2频")
| (df["邮路"] == "天津-塘沽二路1频")| (df["邮路"] == "天津-塘沽二路2频")
| (df["邮路"] == "天津-大港1频") | (df["邮路"] == "天津-大港2频")
| (df["邮路"] == "天津-武清一频") | (df["邮路"] == "天津-武清二频")
| (df["邮路"] == "天津-黄花店一频")| (df["邮路"] == "天津-黄花店二频")
| (df["邮路"] == "天津-宝坻1频")| (df["邮路"] == "天津-宝坻2频")
| (df["邮路"] == "天津-蓟县1频")| (df["邮路"] == "天津-蓟县2频")
| (df["邮路"] == "天津-宁河1频") | (df["邮路"] == "天津-宁河2频")
| (df["邮路"] == "天津-静海1频") | (df["邮路"] == "天津-静海2频")
| (df["邮路"] == "天津-东丽1频") | (df["邮路"] == "天津-东丽2频")
| (df["邮路"] == "天津-西青1频") | (df["邮路"] == "天津-西青2频")].数量.sum()print(df1,"ws开头和速处")
print(df2,"城区出口",df3,"区县出口")
a = df2 + df3
all = df["数量"].sum()
print(all,"表格中出口总量")
print(a,"天津市出口量")
print(all-a-df1,"一干的计算是总量减去市内减去区县减去ws和速处")

进口测试:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime
from pandas import Series, DataFrame
df = pd.read_excel('data/17in.xls')
#print(df)
#a=df.loc[(df['youlu'] == "天津蓟县")].num.sum()
#print(a)df1 = df.loc[(df["邮路"]=="WS30005000") | (df["邮路"] == "WS30007000") | (df["邮路"] == "WS30006000")| (df["邮路"] == "WS30008100")| (df["邮路"] == "WS30004000")|(df["邮路"] == "WS30007200")|(df["邮路"] == "WS30002000")|(df["邮路"] == "大宗收寄-中心局2")].数量.sum()#."1".sum()df2 = df[(df["邮路"]=="11点趟班1路") | (df["邮路"] == "11点趟班2路") | (df["邮路"] == "11点趟班3路")| (df["邮路"] == "11点趟班4路")| (df["邮路"] == "11点趟班5路")| (df["邮路"] == "11点趟班6路")
|(df["邮路"] == "11点趟班7路")| (df["邮路"] == "11点趟班8路")| (df["邮路"] == "11点趟班9趟")
| (df["邮路"] == "11点趟班10路")| (df["邮路"] == "11点趟班11路")| (df["邮路"] == "11点趟班12路")
| (df["邮路"] == "11点趟班13路")
#print(df[0] == "11点趟班3路")
#print()
|(df["邮路"]=="15点趟班1路") | (df["邮路"] == "15点趟班2路") | (df["邮路"] == "15点趟班3路")|(df["邮路"] == "15点趟班4路")| (df["邮路"] == "15点趟班5路")| (df["邮路"] == "15点趟班6路")
| (df["邮路"] == "15点趟班7路")| (df["邮路"] == "15点趟班8路")| (df["邮路"] == "15点趟班9路")
| (df["邮路"] == "15点趟班10路")| (df["邮路"] == "15点趟班11路")| (df["邮路"] == "15点趟班12路")
| (df["邮路"] == "15点趟班13路")
|(df["邮路"]=="19点趟班1路") | (df["邮路"] == "19点趟班2路") | (df["邮路"] == "19点趟班3路")| (df["邮路"] == "19点趟班4路")| (df["邮路"] == "19点趟班5路")| (df["邮路"] == "19点趟班6路")
| (df["邮路"] == "19点趟班7路")| (df["邮路"] == "19点趟班8路")| (df["邮路"] == "19点趟班9路")
| (df["邮路"] == "19点趟班10路")| (df["邮路"] == "19点趟班11路")| (df["邮路"] == "19点趟班12路")
| (df["邮路"] == "19点趟班13路")].数量.sum()df3 = df[(df["邮路"] == "津南-天津1频")| (df["邮路"] == "津南-天津2频")
| (df["邮路"] == "北辰-天津1频")| (df["邮路"] == "北辰-天津2频")
| (df["邮路"] == "塘沽-天津一路1频")| (df["邮路"] == "塘沽-天津一路2频")
| (df["邮路"] == "塘沽-天津二路1频")| (df["邮路"] == "塘沽-天津二路2频")
| (df["邮路"] == "大港-天津1频") | (df["邮路"] == "大港-天津2频")
| (df["邮路"] == "武清-天津一频") | (df["邮路"] == "武清-天津二频")
| (df["邮路"] == "黄花店-天津一频")| (df["邮路"] == "黄花店-天津二频")
| (df["邮路"] == "宝坻-天津1频")| (df["邮路"] == "宝坻-天津2频")
| (df["邮路"] == "蓟县-天津1频")| (df["邮路"] == "蓟县-天津2频")
| (df["邮路"] == "宁河-天津1频") | (df["邮路"] == "宁河-天津2频")
| (df["邮路"] == "静海-天津1频") | (df["邮路"] == "静海-天津2频")
| (df["邮路"] == "东丽-天津1频") | (df["邮路"] == "东丽-天津2频")
| (df["邮路"] == "西青-天津1频") | (df["邮路"] == "西青-天津2频")
].数量.sum()
#df4 = df[df[2]][8]
df4=df[df["邮路"]== "速处-二枢纽"].数量.sum()
df5 = df[(df["邮路"]=="加车邮路(交中心)") | (df["邮路"]=="函件局-中心局盘")|(df["邮路"] == "容器局-天津中心")].数量.sum()
df6 = df[(df["邮路"]=="塘沽收寄-中心局")|(df["邮路"] == "东丽收寄-中心局")|(df["邮路"] == "津南收寄-中心局")|(df["邮路"]=="红桥收寄-中心局")|(df["邮路"] == "河北收寄-中心局")|(df["邮路"] == "河西收寄-中心局")|(df["邮路"] == "静海收寄-中心局")].数量.sum()
m = df["数量"].sum()
print(m,"表格中进口总量")
print(df1,"--ws开头和大宗收寄  ",df4,"--速处-二枢纽  ",df5,"--加车、函件、容器三个地方到中心局")
print(df2,"--城区趟班   ",df3,"--区县趟班  ",df6,"--各区县收寄")
#print(df3.sum())
#a= df2.sum()+df3.sum()
#print(a)
#print(df4)n1 = df2+df3+df6
print(n1,"市内三部分,城区趟班,区县趟班以及支局收寄")
n = m-df1-df2-df3-df4-df5-df6
print(n,"一干卸车计算=是表格总量-市内三部分-速处-加车函件容器")
n2 = m-df1
print(n2,"卸车(含分替)的量是多少")

使用pandas对excel表格筛选相关推荐

  1. Python入门题031:excel表格筛选重复数据

    题目: 使用 pandas 筛选表格中的重复数据,将筛选后的表格保存到新的 excel 文件中. 视频教程: Python入门题031:excel表格筛选重复数据 代码: import pandass ...

  2. pandas处理excel表格的工作流

    最近师傅让我帮他整理下excel表格,我就自认为很简单的答应了,没想到是自己给自己挖了一个坑,哈哈.遇到了好多问题,因此,写一篇文章记录下. 其实,仔细分析,这个工作流无非就是 当然讲起来容易,中间也 ...

  3. pandas导出excel表格时报错:ValueError: No engine for filetype: ‘‘

    pandas导出excel表格时报错:ValueError: No engine for filetype: '' pandas导出表格时报错 解决办法 pandas导出表格时报错 raise Val ...

  4. python中用pandas读写excel表格,根据关键字查找填表(类似vlookpup)

    python中用pandas读写excel表格,根据关键字查找填表(类似vlookpup) excel的vlookup出了N/A值 相关的库 读取和写入excel文件 查找赋值1 遍历表格每行 查找填 ...

  5. pandas读写Excel表格数据

    [高心星出品] 文章目录 前言 一.pandas是什么? 二.使用步骤 1.安装pandas库 2.安装openpyxl库 3.导入pandas库 4.pandas读取表格数据 5.将数据存入表格 总 ...

  6. pandas读取Excel表格(read_excel)

    个人觉得这个视频讲的非常好 Pandas pandas读取Excel表格pandas读取表格read_excel函数python读取Excel表格数据-哔哩哔哩 这个也不错!!! pandas读取Ex ...

  7. python使用xlsx和pandas处理Excel表格的操作步骤

    python的神器pandas库就可以非常方便地处理excel,csv,矩阵,表格 等数据,下面这篇文章主要给大家介绍了关于python使用xlsx和pandas处理Excel表格的操作步骤,文中通过 ...

  8. python利用pandas合并excel表格代码_利用Python pandas对Excel进行合并的方法示例

    前言 在网上找了很多Python处理Excel的方法和代码,都不是很尽人意,所以自己综合网上各位大佬的方法,自己进行了优化,具体的代码如下. 博主也是新手一枚,代码肯定有很多需要优化的地方,欢迎各位大 ...

  9. c语言读取excel表格_利用pandas处理excel表格

    这不是一篇详细介绍pandas的文章,只是我在利用python处理excel表格时找到的一些临时方案,为了避免忘记,记录在这里,也可能对你有帮助. pandas在对excel处理上使用的是xlrd和x ...

最新文章

  1. iOS 线程之GCD的高级使用方法
  2. Xilinx® 7 series FPGAs CLBs专题介绍(二)
  3. C# String部分方法的例子StringBuilder的简单介绍
  4. 新手学python用什么软件-初学 Python 需要安装哪些软件?
  5. FFMpeg中apiexample.c例子分析——解码分析
  6. [已解决]fdfs-client-py==1.2.6安装失败
  7. scala-wordcount
  8. Qt文档阅读笔记-Multiple Inheritance Example 实例解析及Automatic Connections解析
  9. 为什么显卡更新换代极快,每年都会有更强的新系列,而声卡却永远停留在了“兼容DX9的集成声卡“?
  10. IT职场人生系列之十二:语言与技术I
  11. java获取文件目录列表_获取目录中的文件列表
  12. 学习pytorch: 深度学习入门建议
  13. 第一次使用公有云需要注意啥
  14. 计算机联锁中JDF是什么组合,2019年新准线海勒斯壕南站站改工程招标公告
  15. Java GUI实现简单弹珠游戏(新手入门练习项目)
  16. iOS软键盘弹出后视图向上移动
  17. Imatest客观测试之信噪比动态范围
  18. 揭秘Facebook官方底层C++底层函数Folly
  19. 爱因互动王守崑:未来机器人的服务质量会显著高于人类
  20. 异质性区域下的宏观基本图构建

热门文章

  1. java 商品评价_java 商品评价计算算法
  2. FPGA series # 基于SDx的fft函数加速
  3. 测试服务器UDP/TCP丢包率
  4. 软件设计模式与体系结构实验——2.1-1(2)(抽象)工厂模式的应用
  5. android 项目练习:自己的词典app——生词本(一)
  6. 基于nodejs+vue的社区问答网站与设计
  7. Java redis实现消息队列
  8. 在Groovy中使用字符串
  9. Scrapy框架采集微信公众号数据,Python大佬机智操作绕过反爬验证码
  10. Win11怎么查MAC地址?Win11电脑如何查看mac地址?