python开发跟淘宝有关联微_Python_淘宝用户行为分析
一、数据导入与清洗
源数据量有1亿余条,为减轻计算量,抽样总量的20%用于计算分析
#coding=gbk
import numpy as py
import pandas as pd
import datetime
import os
os.chdir('D:/pythonlily/test1')
data=pd.read_csv('UserBehavior.csv',header=None)
data.columns=['用户id','商品id','商品类目id','行为类型','时间戳']
df=data.sample(frac=0.2)
抽样后的数量大约2000w,查看下数据集整体情况
官方说时间范围是2017年11月25日至2017年12月3日之间,但是从这里看出时间有异常值,剔除异常值,只筛选2017年11月25日至2017年12月3日的数据。剔除时间异常值1w+条后,仍有2000w+的数量。
df=df[(df['时间戳']<1512316800)&(df['时间戳']>1511539200)]
将时间戳转换为日期格式
tt=[]
for i in range(0,len(df)):
row= df['时间戳'].iloc[i]
a = int(row)
date = datetime.datetime.fromtimestamp(a)
targetDate = date.strftime("%Y-%m-%d%H:%M:%S")
tt.append(targetDate)
df['日期']=tt
二、提出问题并计算分析
01用户行为转化漏斗,找到需要改进的环节,即uv→pv→(cart+fav)→buy
02从一周的时间维度了解用户的行为习惯,即计算每日各环节的用户行为
03从一天24H时间维度了解用户的行为习惯,即计算用户各个时间段的用户行为差别
04不同商品类目中用户行为的差别分析,购买次数占前80%的品类有多少?
01用户行为转化漏斗
uv=len(df['用户id'].unique())
temp=df[df['行为类型']=='pv'].loc[:,['用户id']]
pv=len(temp['用户id'].unique())
temp=df[df['行为类型']=='fav'].loc[:,['用户id']]
fav=len(temp['用户id'].unique())
temp=df[df['行为类型']=='cart'].loc[:,['用户id']]
cart=len(temp['用户id'].unique())
temp=df[df['行为类型']=='buy'].loc[:,['用户id']]
buy=len(temp['用户id'].unique())
所以uv=980383,pv=972254,cart=464816,fav=221842,buy=283387,总体转化率为buy/uv=28.9%,各环节转化率漏斗图如下:
02从一周的时间维度了解用户的行为习惯
df['日期2']=df['日期'].str[:10] #提取字符串类型中的日期
ff=df[['用户id','行为类型','日期2']]
pd.pivot_table(ff,index=['日期2'],columns=['行为类型'],aggfunc='count',fill_value=0)
由此可知,周末(12/2、12/3)用户的各种行为数明显高于其他日期,这很正常。看看转化率:
一般情况下,用户选中心仪的商品直接购买,少部分用户先收藏或者加入购物车后再付款购买。上图显示周末的收藏+购物车的转化率显著上升、购买率有所下滑的,可能用户在周末时间比较充裕、货比三家的行为更多,购买行为比工作日更加理性。
03从一天24H时间维度了解用户的行为习惯
df['时刻']=df['日期'].str[11:13]
dd=df[['用户id','时刻','行为类型']]
pd.pivot_table(dd,index='时刻',columns='行为类型',aggfunc='count')
一天中凌晨3~6点的用户量是最少的,白天11~19点这8个小时,各种用户行为发生的数量是比较平稳的,晚上8点后至11点用户的访问量快速上升,达到最高峰 。
收藏+购物车的转化率比较稳定,但是购买率最高时段是上午10点~12点,均有30%以上的转化率,用户量最高峰的22~23点反而购买率较低,可能也是白天没有晚上时间充裕,购买行为更加干脆。
04不同商品类目中用户行为的差别分析
计算购买数最多的商品类目id,并查看前20位的购买行为的差别
cc=df[['用户id','商品类目id','行为类型']]
re=pd.pivot_table(cc,index='商品类目id',columns='行为类型',aggfunc='count',fill_value=0)
re=re.reset_index()
re.columns=['商品类目id ','buy','cart','fav','pv']
re=re.sort_values('buy',ascending=False)
re.head(20)
显然购买的最多的商品类目,其浏览点击、收藏、加购物车的行为数量不一定是最高的,即转化率高、而人气不一定最高,大胆猜测下转化率高的类目为男性刚需商品,人气高的商品类目为女性所需商品。
re['购买次数占比']=re['buy']/re['buy'].sum()
re['购买次数累计占比']=re['购买次数占比'].cumsum()
re['购买次数前0.8']=re['购买次数累计占比']<=0.8
re.groupby(['购买次数前0.8']).size()
购买次数前0.8
False 8038
True 687
dtype: int64
所以贡献80%购买次数占比的商品类目个数是687,占所有类目的per=687/8725=8%。
三、结论
1、总体的用户购买率为28.9%,购买转化率与行业的标准进行比较,后面可以采取活动(用户细分,转化路径细查)提高购买转化率。
2、该商铺的用户行为周末比工作日更加活跃,晚上比白天更活跃,并于22:00~23:00点达到活跃高峰值,运营人员可根据活跃时间进行相关的活动;
3、针对不同品类的购买转化率采取不同的策略,提高已购品类的转化率,一方面,对未被购买的品类进行分析,找出原因,促成购买。
python开发跟淘宝有关联微_Python_淘宝用户行为分析相关推荐
- python开发跟淘宝有关联微_python分析淘宝用户行为
今天来分享淘宝用户行为分析的过程,具体可见下图 首先呢,我们需要配置环境,可在https://www.python.org/downloads/www.python.orghttps://www.j ...
- python开发跟淘宝有关联微_使用Python分析淘宝用户行为
一.项目背景 本数据分析报告以手机淘宝app订单数据作为数据集,通过行业常见指标对淘宝用户行为数据进行分析,并给出优化建议.本数据集包含了2014年11月18日至2014年12月18日之间,约八十万随 ...
- python开发跟淘宝有关联微_为什么微商和淘宝卖家不得不做公众号和小程序?
文/王爷 整理/叨叨 最近一个月,微信方面的动作比较多,尤其是有关微信小程序方面的动态,起码更新了4次.或许很多人还不知道什么是微信小程序,简单来说就是一个无需安装.即用即走的生长在微信上的一个应用. ...
- python开发跟淘宝有关联微_基于Python的Apriori和FP-growth关联分析算法分析淘宝用户购物关联度...
关联分析用于发现用户购买不同的商品之间存在关联和相关联系,比如A商品和B商品存在很强的相关性,常用于实体商店或在线电商的推荐系统,例如某一客户购买A商品,那么他很有可能会购买B商品,通过大量销售数据找 ...
- python开发跟淘宝有关联微_利用Python分析淘宝用户行为
目录 1.提出问题 2.理解数据 3.清理数据 4.建模分析 5.提出建议 1. 提出问题 每天淘宝都有大量的用户访问量,但最终完成交易的用户只是其中极少数: 为改善整个购物流程中的流失率,将通过研究 ...
- python开发跟淘宝有关联微_python - 爬取某淘宝店铺所有宝贝遇到的问题?
问 题 在爬一个淘宝店铺的信息时发现会通过jsonp去网站取回数据,url如下: https://tianziyujushangcheng.taobao.com/i/asynSearch.htm?ca ...
- python营销骗局_python案例:金融营销活动中欺诈用户行为分析
首先,数据导入 1 importnumpy as np2 importpandas as pd3 from collections importCounter4 importmatplotlib.py ...
- python开发linux桌面应用_Linux程序员宝典:2020年10款出色的Python IDE!
Python是一种通用编程语言,可用于构建一切:从后端Web开发.数据分析.人工智能到科学计算,不一而足.它还可以用于开发生产力软件.游戏.桌面应用及其他软件. Python简单易学,语法和缩进结构简 ...
- python开发跟淘宝有联系没_python每日获取淘宝首页关键字推荐词
每日美图 介绍 因为自己想着手搞一波淘宝,准备用于获取淘宝首页关键字推荐词,想化妆品.服装这种我们是不适合做的竞争太大了. 我们暂时定为水杯这种小类目的,对于新开的店面除了刷单,最重要的还是自然流量. ...
最新文章
- 详解Nginx SSL快速双向认证配置(脚本)
- SpringBoot+Shiro学习(八):RememberMe
- 淘宝账号基于OAuth2.0的登录验证授权登陆第三方网站
- Xcode中捕获iphone/ipad/ipod手机摄像头的实时视频数据
- 动手实操丨基于随机森林算法进行硬盘故障预测
- 【BZOJ2337】XOR和路径,概率期望DP+高斯消元
- Web前端程序员必备 前端面试题汇总(1)
- ImportError: No module named bs4
- 第一篇:工作之我见一-----------细节决定成败(1)
- JAVA--文本编辑器
- 怎么把计算机隐藏文件显示出来,隐藏文件夹怎么显示出来
- 软件工程作业——《人件》读书笔记
- 利用frps进行内网穿透
- C语言动态内存开辟详解(malloc,calloc,realloc,free,柔型数组)
- vue-cli3 跑项目时 ‘98%’ after emitting CopyPlugin
- C++ 算法篇 位运算
- 应用充满想象 内存计算或颠覆商业模式
- LTI系统的频域分析法
- cisco pkt 路由器配置基础及接口配置 路由协议与交换技术
- python3 爬虫之爬取糗事百科
热门文章
- Navicat连接Mysql 8.0.16报错:Client does not support authentication protocol requested by server?
- python 变量类型list_Python基础变量类型——List浅析-阿里云开发者社区
- I/0口输入输出实验 学习IO口的位操作方法,分别选择P0、P1、P2、P3端口中的某一位,该位作为输出使用,连接一只发光二极管,控制器闪烁。
- 正在从“vetur”获取代码操作_长时间运行 io.Reader 和 io.Writer 操作测算进度和估算剩余时间...
- 关于 m1 xcode12 编译报错 this target. for architecture arm64等问题解决方案
- ndows10同时打印多份文档,Windows10如何同时重命名多个文件
- shell脚本给mysql创建表_shell脚本:实现MySQL创建数据库和删除数据库的脚本
- excel工具箱_WPS搬来救兵智能工具箱,强大到Excel没有还手之力
- python实现雪花飘落的效果_使用javascript实现雪花飘落的效果
- c3p0 服务启动获取连接超时_JDBC数据库连接池