Python数据分析--统计注册用户
题目
领导赵老丝er给淑芬一张表 data,这张表有两个字段,uid(用户id),reg_time(注册时间)。赵老丝er想知道某一天的新增用户数 和 以及该天过去7日内 每天新增用户总数 和平均数。
(欲哭还有泪的淑芬er)
data表如下:
Python代码实现:
方法一:
import pandas as pd,numpy as np
df=pd.read_excel("data.xlsx")
df["reg_time"]=df["reg_time"].astype("datetime64[ns]")
df["reg_time"]=df["reg_time"].dt.date #2021/12/7 12:34:09 转为 2021/12/7
df1=df.groupby("reg_time")
res=pd.DataFrame(columns=["当日注册数","近七日注册数","近七日注册平均人数"])
for i ,j in df1:m=j["uid"].count() #当日注册总人数t1=i-pd.Timedelta(6,unit="day") #上周的日期df2=df.query("reg_time>=@t1 & reg_time<= @i")["uid"] #筛选上周到当日 uid 的数据unique_day=df.query("reg_time>=@t1 & reg_time<= @i").reg_time.nunique() #这一步主要是为了解决 开始时间2015-01-01 减去7天没有数据情况,直接除以7 不准确reg_sum=df2.count()reg_avg=f"{reg_sum/unique_day:.2f}"res.loc[i]=[m,reg_sum,reg_avg]
res
方法二:窗口计算rolling
import pandas as pd,numpy as np
df=pd.read_excel("data.xlsx")
df=df.groupby("reg_time").count()
df[["近七日注册数","近七日注册平均人数"]]=df.rolling("7D").agg([sum,"mean"])
#数据格式调整
df=df.rename(columns={"uid":"当日注册数"})
df.index=df.index.date
df
欢迎大家留言讨论,多多分享你的思路,淑芬感激不尽。抱拳了铁子
Python数据分析--统计注册用户相关推荐
- python数据分析实战之用户分析及RFM模型分析
理论基础知识可以看我之前的博客: 1.python之Numpy知识点详细总结 2.python最最最重要的数据分析工具之pandas 3.pandas之表连接与高级查询 也可以进入我的专栏:欢迎订阅哦 ...
- 网易微专业python数据分析统计服_40套大数据云计算高级实战精品,数据分析,数据仓库,数据爬虫,项目实战,用户画像, ......
40套大数据云计算高级实战精品,数据分析,数据仓库,数据爬虫,项目实战,用户画像,日志分析,Hadoop,Flink,Spark,Kafka,Storm,Docker,ElaticStack等视频教程 ...
- 转行学python 数据分析统计服_转行数据分析,你准备好了吗?
前言 笔者从去年5月份下定决心离开汽车制造行业,6月份开始学习Udacity的DAND(Data Analysis Nano Degree, 数据分析纳米学位)课程至今.历经10个月挑灯苦读和1个月四 ...
- 泰坦尼克号python数据分析统计服_数据分析可视化——泰坦尼克号幸存者分析(上)...
文章目录数据获取.结构分析如何获取seaborn提供数据源 特征列分析 缺失值与数据清洗年龄缺失值处理 填充embarked 删除不必要的列 幸存者分析分析性别对存活率的影响 分析年龄对存活率影响 分 ...
- 转行学python 数据分析统计服_25岁转行数据分析的学习计划
我在通讯电子行业工作了近三年,平时主要运营渠道客户.用EXCEL分析销售数据,PPT制作报告:初识数据分析,现在想想,还是在工作一年以后:当时突然接到一个紧急的业务,数十万条数据,需要对数据进行多次单 ...
- 泰坦尼克号python数据分析统计服_Titanic数据分析报告(Python)
研究目的:使用机器学习来创建一个模型,该模型可以预测哪些乘客在泰坦尼克号沉船事故中幸存下来. 研究结论: 分析过程: 本次分析使用Jupter Notebook进行分析 该notebook 服务的版本 ...
- 泰坦尼克号python数据分析统计服_泰坦尼克号乘客数据分析
本文是优达学城数据分析师 P2 项目的结课报告,主要探寻泰坦尼克号上的生还率和各因素(客舱等级.年龄.性别.上船港口等)的关系. # Imports import numpy as np import ...
- 泰坦尼克号python数据分析统计服_python数据处理——泰坦尼克
承接上篇豆瓣数据分析 本次主要是进行以下内容: 1.泰坦尼克号的数据分析,主要分析哪些特征影响了乘客的获救和遇难,是年龄?是性别? #泰坦尼克数据集导入 titanic_df = sns.load_d ...
- 泰坦尼克号python数据分析统计服_Python-数据可视化案例分析之泰坦尼克号(二)...
在第一节"Python-数据清洗与分析案例之泰坦尼克号(一)"网址:https://www.lixdx.cn/archives/93 中进行了数据清洗与缺失值填充,接下来进行数据可 ...
最新文章
- mysql alter算法_MySQL ALTER命令_mysql alter_添加_删除_修改
- unity点击按钮换按钮图标
- 用Linux命令行生成随机密码的十种方法
- 分支管理---Feature分支
- [web性能优化] - 使用在线工具对html、js、css进行压缩
- 焊接机器人应用现状及发展趋势
- 100万用户服务器_我的应用在一个月内如何增长超过100万用户
- HTML+CSS+JS实现燃烧的火焰火花动画特效
- 【C语言】scanf()输入浮点型数据
- Python requests库中文乱码问题汇总(编码)
- GB28181-2016系统相关技术介绍
- 安卓recovery流程分析【第二篇】
- mybatis 查询
- Til the Cows Come Home-Poj2387(最短路)
- excel二极管伏安特性曲线_电视机不被烧,是因为它?一个拥有反向特性的稳压二极管...
- 【专栏】腾讯产品:写给产品经理和设计师的用户体验知识3
- 弹性域 mysql_R12 AR INVOICE 接口表导入详解
- ANSNP中线安防 安科瑞 时丽花
- Eclipse 代码整理
- 雷鸣的游戏人生(七) --- 如何谈一场失败的恋爱?
热门文章
- 谈女人 作者:张爱玲
- 央企建筑公司数字化转型最大挑战是什么?如何破解?
- 为什么说盲盒市场充满机遇
- linux/windows_vscode_配置mingw的C/C++环境(by official doc)/一些可能遇到的问题和对策)/vscode中文输出乱码问题
- heic图片如何在电脑上直接打开查看使用
- input输入框只能输入11位数字
- RTX 3060 快速配置GPU版本tensorflow
- 操作指南丨利用IPFS相关技术/工具托管网站
- 黑科技丨电脑必备的chrome插件(一)
- 长城汽车计划将P系列皮卡推向全球市场