行式 Excel 文件比对
两个Excel文件,有多列数据,第一行是列名,第二行开始是数据记录,要对两个文件中关键列的内容进行比对。处理此问题可以把文件读成数据集,取出关键列的记录值组成一个集合,然后通过两个集合的运算得出结果。
有2018、2019年的销售订单表order_2018.xlsx和order_2019.xlsx,两文件有相同的列结构,部分数据如下所示:
1. 找相同
把两个文件中关键列值相同的都找出来。
示例:请找出这两年都购买了同一种产品的用户CustomerId和产品ProductId,记录在c_p.txt文件中。
esProc SPL脚本如下:
A | |
1 | =T("e:/orders/order_2018.xlsx";CustomerId,ProductId) |
2 | =T("e:/orders/order_2019.xlsx";CustomerId,ProductId) |
3 | =[A1,A2].merge@io() |
4 | =T("e:/orders/c_p.xlsx",A3) |
A1 读出order_2018.xlsx的关键列CustomerId,ProductId数据
A2 读出order_2019.xlsx的关键列CustomerId,ProductId数据
A3 对两年数据进行归并,@i表示返回共同包含的记录
A4 将A3中的结果写入c_p.xlsx中
2. 找不同
示例1:找出2019年新增客户的订单情况,保存在文件new_c.xlsx中, esProc SPL脚本如下:
A | |
1 | =T("e:/orders/order_2018.xlsx") |
2 | =T("e:/orders/order_2019.xlsx") |
3 | =A2.id(CustomerId)\A1.id(CustomerId) |
4 | =A2.select(A3.contain(CustomerId)) |
5 | =T("e:/orders/new_c.xlsx",A4) |
A1 读出order_2018.xlsx的数据
A2 读出order_2019.xlsx的数据
A3 用2019年所有客户Id减去2018年的,得到新增的客户Id
A4 从2019年订单表筛选出新增客户的订单
A5 将A4中的结果写入new_c.xlsx中
示例2:找出2019年所有流失的客户Id,保存在文件lost_c.xlsx中, esProc SPL脚本如下:
A | |
1 | =T("e:/orders/order_2018.xlsx") |
2 | =T("e:/orders/order_2019.xlsx") |
3 | =A1.id(CustomerId)\A2.id(CustomerId) |
4 | =file("e:/orders/lost_c.xlsx").xlsexport(A3) |
A1 读出order_2018.xlsx的数据
A2 读出order_2019.xlsx的数据
A3 用2018年所有客户Id减去2019年的,得到流失的客户Id
A4 将A3中的结果写入lost_c.xlsx中,因为A3中的结果是序列,不是序表,所以这里不能用T函数来保存数据
行式 Excel 文件比对相关推荐
- 行式 Excel 文件拆分
有订单表文件orders.xlsx部分数据如下图所示,第1行是列标题,第2行开始是数据记录,每行一条记录. 1. 分类拆分 对文件中数据进行分类,把每类数据单独存为一个文件,用分类名为文件命名. 示 ...
- python按行读取excel文件_python3读取excel文件只提取某些行某些列的值方法
今天有一位同学给了我一个excel文件,要求读取某些行,某些列,然后我试着做了一个demo,这里分享出来,希望能帮到大家: 首先安装xlrd: pip3 install xlrd 然后上代码: imp ...
- 如何用行式 Excel 数据制作不定行列的分组交叉统计表
需求说明 现在有某月产品销售明细数据的 Excel 文件,各订单数据按行存放,如下 要求根据"客户地区"和"产品类别"分组,具体地区及类别根据 Excel 对应 ...
- python按行读取excel文件_python读取excel文件
读取excel表格数据需要用到xlrd或者openpyxl模块,所以先安装xlrd/openpyxl:直接pip install xird/openpyxl xlrd和openpyxl区别: 1.xl ...
- python 导出大量数据到excel_怎么在python中将大量数据导出到Excel文件
怎么在python中将大量数据导出到Excel文件 发布时间:2021-01-16 11:09:40 来源:亿速云 阅读:76 作者:Leah 这期内容当中小编将会给大家带来有关怎么在python中将 ...
- mysql ajax excel文件_关于导入EXCEL和AJAX
在一个项目当中,从顶部做到的底部,我了解到了关于以前一些不能理解的东西的合理解释.对于我们所处的这个项目,总体是基于.net和SQL开发的一种后 台管理模式.其中最为复杂的不是代码,而且流程的合理性, ...
- 用python画熊猫_熊猫read_excel()–用Python读取Excel文件
用python画熊猫 We can use the pandas module read_excel() function to read the excel file data into a Dat ...
- 如何从多个Excel文件多个Sheet中搜索某一内容,多个excel文件批量查找的绿色工具
如何在多个EXCEL文件中批量搜索或批量查找,并展示出查找内容所在的行,所在的文件.所在表信息. 在日常办公中,经常从面临多个Excel文件查找出需要的信息.对于复杂的信息有时候也需要支持正则表达式的 ...
- java 更改excel文件名称_根据Excel文件中的内容,修改指定文件夹下的文件名称
问题:根据Excel文件中内容,把文件名称由第2列,改为第1列.比如:把文件"123.jpg"修改为"1.jpg". aaarticlea/png;base64 ...
- POI生成excel文件以及预览文件功能
逻辑如下,先得到一个list,然后遍历list的详情放到对应的excel表中,我这里生成的是xlsx文件.如果是xls文件代码会稍微不同,暂时不贴出了,测试例子如下 //生成excel文件public ...
最新文章
- 有没有哪些数学猜想是验证到很大的数以后才发现是错的?
- 12306 说:有时候,能排队也是一种幸福!
- c#oracle数据库操作类,Oracle数据库操作类(c#)
- 项目分析(map复习)
- ubuntu下minicom的安装及使用
- [算法笔记]二叉树基础
- 获取控件坐标位置一直是0
- srgan要训练多久_SRGAN阅读笔记
- Oracle死锁解决常用方法
- 【java】基于JWT的token身份认证方案
- ZooKeeper分布式应用程序的分布式协调服务:概述,入门,发布版本
- 30个实用的 Photoshop 动作《免费下载》
- Android高手进阶:Adapter深入理解与优化
- Unity(八)脚本生命周期
- 台式计算机密码忘了怎么办,台式机开机密码忘了怎么办
- 安卓的数据共享——从一个APP中调用另一个APP数据的方法
- 盈余贝分享网赚项目的思维和观念
- 人工智能 —— 语义网络推理
- 会议室LED大屏如何实现无线连接投屏显示?
- 荣誉系统排名是整个服务器,魔兽世界60年代的PVP荣誉系统、军阶对照表和各职业的徽记效果...
热门文章
- 小米6显示服务器出错,小米6解锁BL显示未连接手机解决办法以及各种小技巧汇总......
- 实现图片懒加载的方法
- x86_64 x86 amd64 i386 i686 aarch64等词语含义
- 新浪微博发布文章html,微博怎么发文章
- XRHT电钢琴电子琴实训室教学管理系统配置方案
- Hessian matrix黑塞矩阵(海森矩阵)和雅克比矩阵Jacobian matrix
- 双曲正切函数(tanh)
- 天线接口 IPEX接口 SMA接口 U.FL、IPX 天线的工作原理 天线的种类
- python计算sinx在0-2π_定积分[0,2π]|sinx|
- centos7下安装zmap