题目

领导赵老丝er给淑芬一张表 data,这张表有两个字段,uid(用户id),reg_time(注册时间)。赵老丝er想知道某一天的新增用户数 和 以及该天过去7日内 每天新增用户总数平均数。

(欲哭还有泪的淑芬er)

data表如下:

Python代码实现:

方法一:

import pandas as pd,numpy as np
df=pd.read_excel("data.xlsx")
df["reg_time"]=df["reg_time"].astype("datetime64[ns]")
df["reg_time"]=df["reg_time"].dt.date  #2021/12/7  12:34:09   转为  2021/12/7
df1=df.groupby("reg_time")
res=pd.DataFrame(columns=["当日注册数","近七日注册数","近七日注册平均人数"])
for i ,j in df1:m=j["uid"].count() #当日注册总人数t1=i-pd.Timedelta(6,unit="day") #上周的日期df2=df.query("reg_time>=@t1 & reg_time<= @i")["uid"] #筛选上周到当日 uid 的数据unique_day=df.query("reg_time>=@t1 & reg_time<= @i").reg_time.nunique() #这一步主要是为了解决 开始时间2015-01-01 减去7天没有数据情况,直接除以7 不准确reg_sum=df2.count()reg_avg=f"{reg_sum/unique_day:.2f}"res.loc[i]=[m,reg_sum,reg_avg]
res

方法二:窗口计算rolling

import pandas as pd,numpy as np
df=pd.read_excel("data.xlsx")
df=df.groupby("reg_time").count()
df[["近七日注册数","近七日注册平均人数"]]=df.rolling("7D").agg([sum,"mean"])
#数据格式调整
df=df.rename(columns={"uid":"当日注册数"})
df.index=df.index.date
df

欢迎大家留言讨论,多多分享你的思路,淑芬感激不尽。抱拳了铁子

Python数据分析--统计注册用户相关推荐

  1. python数据分析实战之用户分析及RFM模型分析

    理论基础知识可以看我之前的博客: 1.python之Numpy知识点详细总结 2.python最最最重要的数据分析工具之pandas 3.pandas之表连接与高级查询 也可以进入我的专栏:欢迎订阅哦 ...

  2. 网易微专业python数据分析统计服_40套大数据云计算高级实战精品,数据分析,数据仓库,数据爬虫,项目实战,用户画像, ......

    40套大数据云计算高级实战精品,数据分析,数据仓库,数据爬虫,项目实战,用户画像,日志分析,Hadoop,Flink,Spark,Kafka,Storm,Docker,ElaticStack等视频教程 ...

  3. 转行学python 数据分析统计服_转行数据分析,你准备好了吗?

    前言 笔者从去年5月份下定决心离开汽车制造行业,6月份开始学习Udacity的DAND(Data Analysis Nano Degree, 数据分析纳米学位)课程至今.历经10个月挑灯苦读和1个月四 ...

  4. 泰坦尼克号python数据分析统计服_数据分析可视化——泰坦尼克号幸存者分析(上)...

    文章目录数据获取.结构分析如何获取seaborn提供数据源 特征列分析 缺失值与数据清洗年龄缺失值处理 填充embarked 删除不必要的列 幸存者分析分析性别对存活率的影响 分析年龄对存活率影响 分 ...

  5. 转行学python 数据分析统计服_25岁转行数据分析的学习计划

    我在通讯电子行业工作了近三年,平时主要运营渠道客户.用EXCEL分析销售数据,PPT制作报告:初识数据分析,现在想想,还是在工作一年以后:当时突然接到一个紧急的业务,数十万条数据,需要对数据进行多次单 ...

  6. 泰坦尼克号python数据分析统计服_Titanic数据分析报告(Python)

    研究目的:使用机器学习来创建一个模型,该模型可以预测哪些乘客在泰坦尼克号沉船事故中幸存下来. 研究结论: 分析过程: 本次分析使用Jupter Notebook进行分析 该notebook 服务的版本 ...

  7. 泰坦尼克号python数据分析统计服_泰坦尼克号乘客数据分析

    本文是优达学城数据分析师 P2 项目的结课报告,主要探寻泰坦尼克号上的生还率和各因素(客舱等级.年龄.性别.上船港口等)的关系. # Imports import numpy as np import ...

  8. 泰坦尼克号python数据分析统计服_python数据处理——泰坦尼克

    承接上篇豆瓣数据分析 本次主要是进行以下内容: 1.泰坦尼克号的数据分析,主要分析哪些特征影响了乘客的获救和遇难,是年龄?是性别? #泰坦尼克数据集导入 titanic_df = sns.load_d ...

  9. 泰坦尼克号python数据分析统计服_Python-数据可视化案例分析之泰坦尼克号(二)...

    在第一节"Python-数据清洗与分析案例之泰坦尼克号(一)"网址:https://www.lixdx.cn/archives/93 中进行了数据清洗与缺失值填充,接下来进行数据可 ...

最新文章

  1. mysql alter算法_MySQL ALTER命令_mysql alter_添加_删除_修改
  2. unity点击按钮换按钮图标
  3. 用Linux命令行生成随机密码的十种方法
  4. 分支管理---Feature分支
  5. [web性能优化] - 使用在线工具对html、js、css进行压缩
  6. 焊接机器人应用现状及发展趋势
  7. 100万用户服务器_我的应用在一个月内如何增长超过100万用户
  8. HTML+CSS+JS实现燃烧的火焰火花动画特效
  9. 【C语言】scanf()输入浮点型数据
  10. Python requests库中文乱码问题汇总(编码)
  11. GB28181-2016系统相关技术介绍
  12. 安卓recovery流程分析【第二篇】
  13. mybatis 查询
  14. Til the Cows Come Home-Poj2387(最短路)
  15. excel二极管伏安特性曲线_电视机不被烧,是因为它?一个拥有反向特性的稳压二极管...
  16. 【专栏】腾讯产品:写给产品经理和设计师的用户体验知识3
  17. 弹性域 mysql_R12 AR INVOICE 接口表导入详解
  18. ANSNP中线安防 安科瑞 时丽花
  19. Eclipse 代码整理
  20. 雷鸣的游戏人生(七) --- 如何谈一场失败的恋爱?

热门文章

  1. 谈女人 作者:张爱玲
  2. 央企建筑公司数字化转型最大挑战是什么?如何破解?
  3. 为什么说盲盒市场充满机遇
  4. linux/windows_vscode_配置mingw的C/C++环境(by official doc)/一些可能遇到的问题和对策)/vscode中文输出乱码问题
  5. heic图片如何在电脑上直接打开查看使用
  6. input输入框只能输入11位数字
  7. RTX 3060 快速配置GPU版本tensorflow
  8. 操作指南丨利用IPFS相关技术/工具托管网站
  9. 黑科技丨电脑必备的chrome插件(一)
  10. 长城汽车计划将P系列皮卡推向全球市场