python 京东签到_Python实战—京东用户行为分析
一 目的
本文自于京东平台的用户行为,数据集截取了3个字段:customer_id、action_date、type。
本文最主要的目的是练习Python进行数据分析,在此由衷感谢秦路老师的文章:秦路:用Python分析用户消费行为,让学习的课程有了真实落地的机会。
二 数据加载以及预处理
导入相关库以及加载数据集:
空值处理:
数据很干净,并没有空值。
添加时间序列:
三 数据分析
PV分析:
2月15日PV处于最低值是因为春节,3月27、28很可能是技术BUG,导致数据大幅度下降。
销售分析:
同样也是在春节,销量达到最低点,而4月的销售相较于3月,销量有所下滑。
购买次数分析:
购买1次的用户达到10670,2次的为44,3次的只有1次。用户粘性度不高,需要从服务、产品、活动等环节入手,刺激二次消费。
复购率分析:
首先,建立透视表,横向是月份、竖向是用户,数据为此用户当月购买次数。
当月购买二次以及二次以上的记为1,购买1次记为0,没有购买记为NaN。
算出当月复购率:
1%都不到,复购率如前面购买次数的结果相互印证。
回购率分析:
当月购买,下月也购买的记为1,没购买的记为0,当月没购买的记为NaN
进而得到回购率
2月份回购的用户为5个,3月份7个。
用户分层:
按照用户的消费行为,我们简单划分成几个维度:新用户、活跃用户、不活跃用户、回流用户。在此,新用户的定义是第一次消费。活跃用户即老客,在某一个时间窗口内有过消费。不活跃用户则是时间窗口内没有消费过的老客。回流用户是在上一个窗口中没有消费,而在当前时间窗口内有过消费。在此分析每天用户的活跃状态,并假设只要有行为就算一次活跃。
首先,建立数据透视表。
以下函数的意思是:当天没有任何行为的,记为unreg;第一次有任何行为,记为new,新用户;后面n天内没有任何行为,记为unactive,不活跃用户;新用户n天后都有行为,记为active,活跃用户;被判定为不活跃用户,又活跃了,记为回流用户。
统计每日的活跃用户、新用户、回流用户、不活跃用户
描述性统计:
可视化:
计算每日回流率:
可视化:
活跃用户:
用户生命周期:
找到用户购买过记录中,最近和最早时间之差。
计算平均生命周期:
平均生命周期1天都不到,是因为0天的用户过多,在此排除掉这些。
一共29个用户,平均生命周期为19天,最大周期为62天。
留存率分析:
之前求出每个用户最早购买记录,和销售表进行连接匹配。
时间分割:
计算每个时间分割后的个数:
计算用户每次的消费间隔,并排除消费间隔为0的用户:
描述统计:
python 京东签到_Python实战—京东用户行为分析相关推荐
- 数据挖掘实战—家用热水器用户行为分析与事件识别
文章目录 引言 一.数据探索分析 1.数据质量分析 1.1缺失值分析 1.2 异常值分析 1.3 重复数据分析 2.数据特征分析 2.1 分布分析 三.数据预处理 1.数据归约之属性归约 2.数据归约 ...
- python京东自动签到_Python 实现京东自动签到领京豆
今天带大家进行模拟京东登录,并进行签到获取京豆,1000 个京豆 = 10 元,毕竟「苍蝇也是肉」,每天用脚本可以获取大概 n 个京豆,是不是一个发现了一个「发家致富」的好路子? 废话不多说,下面开始 ...
- 数据分析与挖掘实战-家用电器用户行为分析与事件识别
家用电器用户行为分析与事件识别 背景 居民使用家电过程中,会因为地区气候.区域不同.年龄差异,形成不同的使用习惯,若能深入了解这些习惯,针对性地开发新功能,便能开拓市场. 本案例以热水器为例,分析用户 ...
- 大数据实战:用户流量分析系统
---------------------------------------------------------------------------------------------------- ...
- python爬虫京东评论_python爬京东评论
我,找回,密码了! 就是这个网址助我! # In[sy_final]: #!/usr/bin/python import requests import json #这个headers害惨了我,一定要 ...
- python秒杀神器_Python实现京东秒杀功能代码
本文实例为大家分享了Python实现京东秒杀功能的具体代码,供大家参考,具体内容如下 #Python 3.5 #coding:utf-8 #import scrapy from selenium im ...
- python京东秒杀_python实现京东秒杀功能
本文实例为大家分享了python实现京东秒杀的具体代码,供大家参考,具体内容如下 # _*_coding:utf-8_*_ from selenium import webdriver import ...
- 有没有关于python的壁纸_Python 实战之精美壁纸下载
之前讲解了爬虫系列的文章<最通俗的Python3网络爬虫入门>今天继续精美壁纸下载(动态网站). 实战背景 已经会爬取文字了,是不是感觉爬虫还是蛮好玩的呢?接下来,让我们进行一个进阶实战, ...
- python买东西_Python实战之ATM+购物车
学python一个月以来的第一个工程级别项目!!!!! 1.首先分析项目需求: 模拟实现一个ATM + 购物商城程序 额度 15000或自定义---->注册功能 实现购物商城,买东西加入 购物车 ...
- python论坛签到_Python实现某论坛自动签到功能
1.[文件] DakeleSign.py ~ 4KB #!/usr/bin/env python # -*- coding: utf-8 -*- __author__ = 'poppy' ''' da ...
最新文章
- C语言编程的Debug版和Release版
- 深入理解Java幂等性
- Java实现心跳机制
- 下载安装webstrom及激活
- Datatable/Dataset 转 JSON方法
- Shell通过过滤条件(比如IP)分类流量包,最后合并流量包
- 框架层 java_简单就是美!浅谈java各层框架。
- AbstractQueuedSynchronizer 源码分析(共享锁)
- 执行conda install tensorflow solving environment一直转圈圈,Anaconda无法打开的问题
- 我的cocos2d-x集成sharesdk之旅(转)
- Altium Designer绘制stm32最小系统原理图
- 投影仪光源与亮度科普
- 写代码时发现……还是Python牛逼
- 当你输入信用卡号码的时候,有没有担心输错了而造成损失呢?其实可以不必这么担心,因为并不是一个随便的信用卡号码都是合法的,它必须通过Luhn算法来验证通过。 该校验的过程:1、从卡号最后一位数字开始,逆
- 明年春天见!罗永浩发声:还完债当天就重返科技行业
- 【计算机网络】笔记及考点
- 项目管理工具之apizza
- python报错:patsy.PatsyError: error tokenizing input (maybe an unclosed string?)
- git拉取远程新分支到本地
- Qt复现pure virtual method called报错,与解决办法
热门文章
- 【解决】 io.lettuce.core.RedisCommandExecutionException: ERR wrong number of arguments for 'set' command
- excel 导出PDF ExportAsFixedFormat函数 报错-2147024809 (0x80070057)
- java查重精确算法_一个查重算法的多种实现思路
- 职称论文通过查重之后就能发表吗?
- 神州数码云平台基础环境搭建
- Excel怎么批量设置图片大小
- 用python实现词频分析+词云
- spss可以关键词词频分析吗_有什么自动分词做词频分析的工具?
- tomcat设置为开机自启动
- Unity Editor 编辑器扩展 九 Gizmos