一、数据导入与清洗

源数据量有1亿余条,为减轻计算量,抽样总量的20%用于计算分析

#coding=gbk

import numpy as py

import pandas as pd

import datetime

import os

os.chdir('D:/pythonlily/test1')

data=pd.read_csv('UserBehavior.csv',header=None)

data.columns=['用户id','商品id','商品类目id','行为类型','时间戳']

df=data.sample(frac=0.2)

抽样后的数量大约2000w,查看下数据集整体情况

官方说时间范围是2017年11月25日至2017年12月3日之间,但是从这里看出时间有异常值,剔除异常值,只筛选2017年11月25日至2017年12月3日的数据。剔除时间异常值1w+条后,仍有2000w+的数量。

df=df[(df['时间戳']<1512316800)&(df['时间戳']>1511539200)]

将时间戳转换为日期格式

tt=[]

for i in range(0,len(df)):

row= df['时间戳'].iloc[i]

a = int(row)

date = datetime.datetime.fromtimestamp(a)

targetDate = date.strftime("%Y-%m-%d%H:%M:%S")

tt.append(targetDate)

df['日期']=tt

二、提出问题并计算分析

01用户行为转化漏斗,找到需要改进的环节,即uv→pv→(cart+fav)→buy

02从一周的时间维度了解用户的行为习惯,即计算每日各环节的用户行为

03从一天24H时间维度了解用户的行为习惯,即计算用户各个时间段的用户行为差别

04不同商品类目中用户行为的差别分析,购买次数占前80%的品类有多少?

01用户行为转化漏斗

uv=len(df['用户id'].unique())

temp=df[df['行为类型']=='pv'].loc[:,['用户id']]

pv=len(temp['用户id'].unique())

temp=df[df['行为类型']=='fav'].loc[:,['用户id']]

fav=len(temp['用户id'].unique())

temp=df[df['行为类型']=='cart'].loc[:,['用户id']]

cart=len(temp['用户id'].unique())

temp=df[df['行为类型']=='buy'].loc[:,['用户id']]

buy=len(temp['用户id'].unique())

所以uv=980383,pv=972254,cart=464816,fav=221842,buy=283387,总体转化率为buy/uv=28.9%,各环节转化率漏斗图如下:

02从一周的时间维度了解用户的行为习惯

df['日期2']=df['日期'].str[:10] #提取字符串类型中的日期

ff=df[['用户id','行为类型','日期2']]

pd.pivot_table(ff,index=['日期2'],columns=['行为类型'],aggfunc='count',fill_value=0)

由此可知,周末(12/2、12/3)用户的各种行为数明显高于其他日期,这很正常。看看转化率:

一般情况下,用户选中心仪的商品直接购买,少部分用户先收藏或者加入购物车后再付款购买。上图显示周末的收藏+购物车的转化率显著上升、购买率有所下滑的,可能用户在周末时间比较充裕、货比三家的行为更多,购买行为比工作日更加理性。

03从一天24H时间维度了解用户的行为习惯

df['时刻']=df['日期'].str[11:13]

dd=df[['用户id','时刻','行为类型']]

pd.pivot_table(dd,index='时刻',columns='行为类型',aggfunc='count')

一天中凌晨3~6点的用户量是最少的,白天11~19点这8个小时,各种用户行为发生的数量是比较平稳的,晚上8点后至11点用户的访问量快速上升,达到最高峰 。

收藏+购物车的转化率比较稳定,但是购买率最高时段是上午10点~12点,均有30%以上的转化率,用户量最高峰的22~23点反而购买率较低,可能也是白天没有晚上时间充裕,购买行为更加干脆。

04不同商品类目中用户行为的差别分析

计算购买数最多的商品类目id,并查看前20位的购买行为的差别

cc=df[['用户id','商品类目id','行为类型']]

re=pd.pivot_table(cc,index='商品类目id',columns='行为类型',aggfunc='count',fill_value=0)

re=re.reset_index()

re.columns=['商品类目id ','buy','cart','fav','pv']

re=re.sort_values('buy',ascending=False)

re.head(20)

显然购买的最多的商品类目,其浏览点击、收藏、加购物车的行为数量不一定是最高的,即转化率高、而人气不一定最高,大胆猜测下转化率高的类目为男性刚需商品,人气高的商品类目为女性所需商品。

re['购买次数占比']=re['buy']/re['buy'].sum()

re['购买次数累计占比']=re['购买次数占比'].cumsum()

re['购买次数前0.8']=re['购买次数累计占比']<=0.8

re.groupby(['购买次数前0.8']).size()

购买次数前0.8

False 8038

True 687

dtype: int64

所以贡献80%购买次数占比的商品类目个数是687,占所有类目的per=687/8725=8%。

三、结论

1、总体的用户购买率为28.9%,购买转化率与行业的标准进行比较,后面可以采取活动(用户细分,转化路径细查)提高购买转化率。

2、该商铺的用户行为周末比工作日更加活跃,晚上比白天更活跃,并于22:00~23:00点达到活跃高峰值,运营人员可根据活跃时间进行相关的活动;

3、针对不同品类的购买转化率采取不同的策略,提高已购品类的转化率,一方面,对未被购买的品类进行分析,找出原因,促成购买。

python开发跟淘宝有关联微_Python_淘宝用户行为分析相关推荐

  1. python开发跟淘宝有关联微_python分析淘宝用户行为

    今天来分享淘宝用户行为分析的过程,具体可见下图 首先呢,我们需要配置环境,可在https://www.python.org/downloads/​www.python.orghttps://www.j ...

  2. python开发跟淘宝有关联微_使用Python分析淘宝用户行为

    一.项目背景 本数据分析报告以手机淘宝app订单数据作为数据集,通过行业常见指标对淘宝用户行为数据进行分析,并给出优化建议.本数据集包含了2014年11月18日至2014年12月18日之间,约八十万随 ...

  3. python开发跟淘宝有关联微_为什么微商和淘宝卖家不得不做公众号和小程序?

    文/王爷 整理/叨叨 最近一个月,微信方面的动作比较多,尤其是有关微信小程序方面的动态,起码更新了4次.或许很多人还不知道什么是微信小程序,简单来说就是一个无需安装.即用即走的生长在微信上的一个应用. ...

  4. python开发跟淘宝有关联微_基于Python的Apriori和FP-growth关联分析算法分析淘宝用户购物关联度...

    关联分析用于发现用户购买不同的商品之间存在关联和相关联系,比如A商品和B商品存在很强的相关性,常用于实体商店或在线电商的推荐系统,例如某一客户购买A商品,那么他很有可能会购买B商品,通过大量销售数据找 ...

  5. python开发跟淘宝有关联微_利用Python分析淘宝用户行为

    目录 1.提出问题 2.理解数据 3.清理数据 4.建模分析 5.提出建议 1. 提出问题 每天淘宝都有大量的用户访问量,但最终完成交易的用户只是其中极少数: 为改善整个购物流程中的流失率,将通过研究 ...

  6. python开发跟淘宝有关联微_python - 爬取某淘宝店铺所有宝贝遇到的问题?

    问 题 在爬一个淘宝店铺的信息时发现会通过jsonp去网站取回数据,url如下: https://tianziyujushangcheng.taobao.com/i/asynSearch.htm?ca ...

  7. python营销骗局_python案例:金融营销活动中欺诈用户行为分析

    首先,数据导入 1 importnumpy as np2 importpandas as pd3 from collections importCounter4 importmatplotlib.py ...

  8. python开发linux桌面应用_Linux程序员宝典:2020年10款出色的Python IDE!

    Python是一种通用编程语言,可用于构建一切:从后端Web开发.数据分析.人工智能到科学计算,不一而足.它还可以用于开发生产力软件.游戏.桌面应用及其他软件. Python简单易学,语法和缩进结构简 ...

  9. python开发跟淘宝有联系没_python每日获取淘宝首页关键字推荐词

    每日美图 介绍 因为自己想着手搞一波淘宝,准备用于获取淘宝首页关键字推荐词,想化妆品.服装这种我们是不适合做的竞争太大了. 我们暂时定为水杯这种小类目的,对于新开的店面除了刷单,最重要的还是自然流量. ...

最新文章

  1. 详解Nginx SSL快速双向认证配置(脚本)
  2. SpringBoot+Shiro学习(八):RememberMe
  3. 淘宝账号基于OAuth2.0的登录验证授权登陆第三方网站
  4. Xcode中捕获iphone/ipad/ipod手机摄像头的实时视频数据
  5. 动手实操丨基于随机森林算法进行硬盘故障预测
  6. 【BZOJ2337】XOR和路径,概率期望DP+高斯消元
  7. Web前端程序员必备 前端面试题汇总(1)
  8. ImportError: No module named bs4
  9. 第一篇:工作之我见一-----------细节决定成败(1)
  10. JAVA--文本编辑器
  11. 怎么把计算机隐藏文件显示出来,隐藏文件夹怎么显示出来
  12. 软件工程作业——《人件》读书笔记
  13. 利用frps进行内网穿透
  14. C语言动态内存开辟详解(malloc,calloc,realloc,free,柔型数组)
  15. vue-cli3 跑项目时 ‘98%’ after emitting CopyPlugin
  16. C++ 算法篇 位运算
  17. 应用充满想象 内存计算或颠覆商业模式
  18. LTI系统的频域分析法
  19. cisco pkt 路由器配置基础及接口配置 路由协议与交换技术
  20. python3 爬虫之爬取糗事百科

热门文章

  1. Navicat连接Mysql 8.0.16报错:Client does not support authentication protocol requested by server?
  2. python 变量类型list_Python基础变量类型——List浅析-阿里云开发者社区
  3. I/0口输入输出实验 学习IO口的位操作方法,分别选择P0、P1、P2、P3端口中的某一位,该位作为输出使用,连接一只发光二极管,控制器闪烁。
  4. 正在从“vetur”获取代码操作_长时间运行 io.Reader 和 io.Writer 操作测算进度和估算剩余时间...
  5. 关于 m1 xcode12 编译报错 this target. for architecture arm64等问题解决方案
  6. ndows10同时打印多份文档,Windows10如何同时重命名多个文件
  7. shell脚本给mysql创建表_shell脚本:实现MySQL创建数据库和删除数据库的脚本
  8. excel工具箱_WPS搬来救兵智能工具箱,强大到Excel没有还手之力
  9. python实现雪花飘落的效果_使用javascript实现雪花飘落的效果
  10. c3p0 服务启动获取连接超时_JDBC数据库连接池