1、existing:此次下单日期时间与上次日期时间的距离在N天以内,精确到时间(时分秒)

2、new:即超过N天

整体思路

1、读取表格的行数据存储成list,并按照时间列的升序排序。

2、维护一个map(在python里是字典dict),每个用户 id 作为key,一个二元组(第几次下单,上一次的日期时间)作为value。

3、遍历表格行数据的list。判断客户 id 是否已经存在于map中,若首次出现,则置该客户 id 在map中的value为[1,'首次下单'],对应行数据新增的4个数据为[1,'首次下单',该次日期时间与上次日期时间差,'new']。若已经存在,则更新map中对应的value为[原次数+1,该次日期时间],对应行数据新增的4个数据为[原次数+1,上次日期时间,间隔时间,new/existing取决于间隔时间与预设N]。

4、将修改过后的行数据list写入到Excel工作簿并保存。

读取表格数据

我们可以用xlrd模块对Excel文件进行读取,以便进一步分析处理数据。示例代码如下:

以上代码成功输出前100行的日期则说明已经成功读取到数据。输出结果如下:

既然读取文件没有问题,进一步浏览整个文件发现存在多余的空行和重复的标题行在读取和转存中可以用正则匹配过滤掉这些行。

将读取的行数据转存到list中,以便进行排序。

将修改后的行数据list写入Excel表格并保存为xslx格式

结果展示

完整代码

python处理excel奖金_60万行的Excel数据,Python轻松处理相关推荐

  1. python处理excel表格-60万行的Excel数据,Python轻松处理

    原标题:60万行的Excel数据,Python轻松处理 一个朋友在某运动品牌公司上班,老板给他布置了一个处理客户订单数据的任务.要求是根据订单时间和客户id判断生成四个新的数据: 1.记录该客户是第几 ...

  2. python内置作用域_python内置金融数据Python 五点搞定作用域

    1.块级作用域 想想此时运行下面的程序会有输出吗?执行会成功吗?#块级作用域 if 1 == 1: name = "lzl" print(name) for i in range( ...

  3. python智慧树期末_智慧树大数据python期末答案

    智慧树大数据python期末答案 中国加入wto后亚洲经济重心迅速向日本向中国转移掀起了本轮经济全球化的库兹涅佐夫号航母着舰区是航母斜角甲板,斜角甲板上面有好的戏剧语言不仅能够推动什么发展同时还能揭示 ...

  4. python分析股票主力_python如何获取股票数据,python股票分析系统

    内容导航: Q1:怎样用python处理股票 用Python处理股票需要获取股票数据,以国内股票数据为例,可以安装Python的第三方库:tushare:一个国内股票数据获取包.可以在百度中搜索&qu ...

  5. python 东方财富接口_Python从东方财富网站获取数据,python,的

    python 获取东方财富网站的数据 #!/usr/bin/env python # -*- coding: utf-8 -*- import pandas as pd from selenium i ...

  6. python大气校正_sen2cor批量大气校正Sentinel2数据——python代码

    上个博客介绍了几种Sentinel数据快速下载的方法,没看到的biubiubiu→→→→→→→→→→→→→→→→→→→→ 接下来分享一下如何在python下调用cmd使用sen2cor批量对Senti ...

  7. 用python读取股票价格_雅虎API获取股票数据--Python

    好久不学Python,计划用Tkinter写一个利用雅虎免费股票查询API的可视化程序 Yahoo股票报价API 获取实时数据 请求url:http://finance.yahoo.com/d/quo ...

  8. linux下下载fnl数据,python处理FNL数据的grib文件和nc文件(纬度存储的问题)

    python处理FNL数据的grib文件和nc文件(纬度存储的问题) python处理FNL数据的grib文件和nc文件(纬度存储的问题) 在使用python处理FNL数据时,2007年及之前的数据存 ...

  9. python: 在txt文档开始位置插入数据

    python: 在txt文档开始位置插入数据 python: 在txt文档开始位置插入数据 常见的在文章末尾追加数据很常见,在开头追加数据不常遇见 代码如下 代码片. import ospath = ...

最新文章

  1. 绕过mysql的id:32933 BUG 实现order by limit 正常取数据.
  2. 循环队列的java结构_Java数据结构——循环队列
  3. gRPC in ASP.NET Core 3.x - gRPC 消息定义
  4. linux之vim复制多行、光标跳转到指定行、插入当前光标上和下行
  5. 锐捷官方提供122套实验题.
  6. Windows Hook机制(转贴一)
  7. 新买的内置光驱读取光盘有杂音的解决办法
  8. Unix/Linux下的open函数(O_CREAT和O_EXCL)
  9. 【Flex】读取本地JSON,然后JSON数据转成XML数据
  10. numpy提供的快速的元素级数组函数
  11. 动态链接库dll,导入库lib,静态链接库lib
  12. 力软的前端_力软快速开发平台,一套完整的管理系统解决方案
  13. 傲腾机器Linux,【收藏】傲腾装机必看!
  14. Ppmap - XSS扫描器
  15. php服务器支付宝的pcm,php - 支付宝当面付报错
  16. TC118AH单通道内置MOS单通道直流无刷马达驱动IC
  17. 基于Android的Word文档阅读器
  18. 视频教程-ps基础课程绝对初级,小白听得懂-Photoshop
  19. 【工具】MobaXterm常用设置
  20. 商用机器人底盘的秘密

热门文章

  1. iOS开发CoreAnimation解读之一——初识CoreAnimation核心动画编程
  2. pat1014. Waiting in Line (30)
  3. python url配置单独放在某个应用目录中
  4. C#实现异步消息队列
  5. ecs服务器内网连接_让不同地域云服务器ECS和云数据库内网互通
  6. android自定义模态框,安卓开发自定义弹出框的简单方式(纯代码布局)
  7. java kettle6_Java调用Kettle6的transaction和job
  8. 邯郸学院计算机专业是本科还是专科,邯郸学院是大学吗 是本科还是专科
  9. 淮阳一高2021高考成绩查询,周口教育网2021年淮阳中招成绩查询系统
  10. java interface 函数_java8函数式接口(Functional Interface)