一、案例数据

数据来源

Kesci:Tmall_makeup

理解数据

数据集包括27599条记录和7个特征变量,数据字典如下:

字段 含义
update_time 交易时间
id 产品编号
title 产品名称
price 单价
sale_count 销量
comment_count 评论数量
店名 店铺名称

说明:
1.每一条记录对应一个产品的销售情况。
2.为了保护商家隐私,数据集中的店名被处理成了化妆品品牌名。

二、数据处理

导入数据库

在MySQL中创建数据库TmallMakeUp2016以及表ProductSale来存储数据。

-- 步骤1:创建数据库TmallMakeUp2016
CREATE DATABASE TmallMakeUp2016;-- 步骤2:创建表ProductSale
USE TmallMakeUp2016;
CREATE TABLE ProductSale(product_id VARCHAR(255) NOT NULL,product_name  VARCHAR(255) NOT NULL,product_brand VARCHAR(255) NOT NULL,product_price DOUBLE NOT NULL,product_comment INT(15),sale_time   DATE NOT NULL,sale_count    INT(15)
);-- 步骤3:MySQL命令行导入数据
LOAD DATA LOCAL INFILE 'F:/sql_work/TmallMakeUp2016/TMALLMAKEUP2016.csv' INTO TABLE TmallMakeUp2016.ProductSale
FIELDS TERMINATED BY ','
IGNORE 1 LINES;-- 步骤4:确认表内容
SELECT * FROM ProductSale;

数据导入结果如下:

数据清洗

用COUNT函数统计各列数据记录数,查看是否有缺失值。

-- 统计缺失值
SELECT COUNT(product_id),COUNT(product_name),COUNT(product_brand),COUNT(product_price),COUNT(product_comment),COUNT(sale_time),COUNT(sale_count)
FROM ProductSale;

缺失值统计结果如下:
根据查询结果,可知导入数据库后数据并没有缺失值。因为如下图所示,在导入数据库时,MySQL自动将缺失值填充为0了。

数据加工

插入一列销售额,用sales表示。

-- 插入销售额sales列
ALTER TABLE ProductSale ADD sales DOUBLE;
UPDATE ProductSale SET sales = product_price * sale_count;-- 确认表数据
SELECT * FROM ProductSale;

插入销售额sales列,并赋值后的结果如下:

删除销售额为0的记录。

-- 删除销售额为0的记录
DELETE FROM ProductSale WHERE sales = 0;

三、数据分析

统计双11活动日期范围

-- 统计双11活动日期范围
SELECT DISTINCT(sale_time) FROM ProductSale;

2016年双11活动日期范围统计结果如下:

从结果可知,2016年双11从11月5日开始,直到11月14日结束。

统计参与双11活动的化妆品品牌范围

-- 统计化妆品品牌范围
SELECT DISTINCT(product_brand) FROM ProductSale;

参加2016年双11活动的化妆品品牌统计结果如下:

从结果可知,参加2016年双11活动的化妆品有自然堂、资生堂、悦诗风吟等19个品牌。

统计双11期间的日销售额

-- 统计双11期间日销售额
SELECT sale_time,ROUND(SUM(sales),2) AS day_sales
FROM ProductSale
GROUP BY sale_time
ORDER BY day_sales DESC;

2016年双11期间,每日的总销售额如下:

从结果可知,2016年双11当天的总销售额是最低的。

统计所有化妆品的总销售额

-- 统计所有化妆品的总销售额
SELECT ROUND(SUM(sales),2) FROM ProductSale;

2016年双11所有化妆品的总销售额如下:

从结果可知,2016年双11期间所有化妆品的总销售额为424亿多人民币。

统计各化妆品品牌的总销量

-- 统计各个品牌的总销量
SELECT product_brand,SUM(sale_count) AS perproduct_salecounts
FROM ProductSale
GROUP BY product_brand
ORDER BY perproduct_salecounts DESC;

2016年双11期间,参与活动的各个化妆品品牌的总销量结果如下:

根据结果可知,2016年双11期间总销量在前10的化妆品品牌是:相宜本草,美宝莲,悦诗风吟,妮维雅,欧莱雅,自然堂,蜜丝佛陀,佰草集,兰芝,美加净。

统计各化妆品品牌的总销量、总销售额以及占销售额的比例

-- 统计各个品牌的总销量、总销售额以及占销售额的比例,并降序排列
SELECT product_brand,product_price,SUM(sale_count) AS perproduct_salecounts,ROUND(SUM(sales),2) AS perbrand_sales,CONCAT(ROUND(SUM(sales)/(SELECT SUM(sales) FROM ProductSale),3)*100,'%') AS ratio
FROM ProductSale
GROUP BY product_brand
ORDER BY perbrand_sales DESC;

结果如下:

从结果可知,2016年双11期间,各化妆品品牌的总销售额占所有化妆品总销售额的比例在前10范围内的是:相宜本草,欧莱雅,佰草集,美宝莲,悦诗风吟,雅诗兰黛,自然堂,兰芝,妮维雅,蜜丝佛陀。显然,并不是总销量越高,总销售额就越高,总销售额的高低还与各品牌各款产品的单价有关。

统计各店铺的SKU

-- 统计各店铺的SKU(商品数),并降序排列
SELECT product_brand,COUNT(product_brand) AS SKU
FROM ProductSale
GROUP BY product_brand
ORDER BY SKU DESC;

2016年双11活动期间,各个化妆品品牌在售商品数如下:

从结果可知,在2016年双11期间,在售商品数最多的是悦诗风吟,其次是佰草集,再次是欧莱雅。

统计销量前10的产品

-- 销量前10产品
SELECT product_brand,product_name,SUM(sale_count)
FROM ProductSale
GROUP BY product_id
ORDER BY SUM(sale_count) DESC LIMIT 10;

2016年双11期间,销量在前10的商品有:

从结果可知,妮维雅男士洗面奶最畅销。

男士护肤品销量排名

-- 男士护肤品销量排名
SELECT product_brand,COUNT(product_brand) AS male_product,ROUND(SUM(sales),2) AS male_productsales
FROM ProductSale
WHERE product_name like '%男%'
GROUP BY product_brand
ORDER BY male_productsales DESC;

2016年双11期间,男士护肤品的销量排名如下:

从结果可知,2016年双11期间,与男士护肤品有关的化妆品品牌中,销量在前10的品牌是:妮维雅,欧莱雅,悦诗风吟,佰草集,相宜本草,倩碧,自然堂,欧珀莱,蜜丝佛陀,资生堂。

男士护肤品销售额排名

-- 男士护肤品销售额排名
SELECT product_brand,COUNT(product_brand) AS male_product,ROUND(SUM(sales),2) AS male_productsales
FROM ProductSale
WHERE product_name like '%男%'
GROUP BY product_brand
ORDER BY male_productsales DESC;

2016年双11期间,男士护肤品的销量额排名如下:

从结果可知,2016年双11期间,与男士护肤品有关的化妆品品牌中,销售额在前10的品牌是:妮维雅,欧莱雅,悦诗风吟,佰草集,相宜本草,倩碧,自然堂,欧珀莱,蜜丝佛陀,资生堂。

女士护肤品销量排名

-- 女士护肤品销量排名
SELECT product_brand,COUNT(product_brand) AS male_product,SUM(sale_count) AS male_salecounts
FROM ProductSale
WHERE product_name like '%女%'
GROUP BY product_brand
ORDER BY male_salecounts DESC;

2016年双11期间,女士护肤品的销量排名如下:

从结果可知,2016年双11期间,与男士护肤品有关的化妆品品牌中,销量在前10的品牌是:相宜本草,悦诗风吟,自然堂,佰草集,妮维雅,欧珀莱,倩碧,兰芝,蜜丝佛陀,美加净。

女士护肤品销售额排名

-- 女士护肤品销售额排名
SELECT product_brand,COUNT(product_brand) AS male_product,ROUND(SUM(sales),2) AS male_productsales
FROM ProductSale
WHERE product_name like '%女%'
GROUP BY product_brand
ORDER BY male_productsales DESC;

2016年双11期间,女士护肤品的销量额排名如下:

从结果可知,2016年双11期间,与男士护肤品有关的化妆品品牌中,销售额在前10的品牌是:相宜本草,自然堂,佰草集,欧珀莱,悦诗风吟,倩碧,兰芝,妮维雅,欧莱雅,雅诗兰黛。

统计各品牌的热度

根据各化妆品品牌的平均评论数来计算各品牌的热度。

-- 统计各品牌的热度
SELECT product_brand,SUM(product_comment) AS total_comment,SUM(product_comment)/COUNT(product_brand) AS hot,SUM(sale_count) AS total_salecount
FROM ProductSale
GROUP BY product_brand
ORDER BY hot DESC;

2016年双11期间,各化妆品品牌的热度如下:

从结果来看,热度的高低对销量的高低有关联。总体上来说,热度上升,会促进产品销量的增加。

统计各品牌的产品平均价格

-- 统计各品牌的平均价格
SELECT product_brand,ROUND(AVG(product_price),2) AS mean_saleprice,ROUND(AVG(sale_count),2) AS perband_salecount
FROM ProductSale
GROUP BY product_brand
ORDER BY mean_saleprice DESC;

2016年双11期间,各化妆品品牌的产品平均价格如下:

从结果来看,并不是平均价格越低,销量就越高。但总体来说,平均价格较低的产品,其销量一般较高。

统计各品牌中参与预售的产品占比

-- 各品牌中,参与预售的产品占比
SELECT product_brand,COUNT(product_brand) AS pre_sale,CONCAT(ROUND(COUNT(product_brand)/(SELECT COUNT(product_brand) FROM ProductSale),5)*100,'%') AS pre_ratio
FROM ProductSale
WHERE product_name like '%预售%'
GROUP BY product_brand
ORDER BY pre_sale DESC;

2016年双11期间,参与预售的各化妆品产品占比如下:

从结果来看,在2016年双11活动期间,参与预售的产品数占比最多的化妆品品牌是倩碧,其次是娇兰,再次是雅诗兰黛。

四、数据结论

数据结论如下:
1.2016年双11活动从11月5日开始,直到11月14日结束。
2.2016年双11活动的总销售额为424亿多人民币,而双11当日的日销售额是最低的。其中,贡献最大的化妆品品牌依次是相宜本草、欧莱雅以及佰草集。
3.2016年双11期间,最畅销的产品是妮维雅男士洗面奶。在所有化妆品品牌中,卖得最好化妆品品牌依次是相宜本草、美宝莲以及悦诗风吟。其中,在男士护肤品中,最畅销的产品品牌依次是妮维雅、欧莱雅以及悦诗风吟;在女士护肤品中,最畅销的产品品牌依次是相宜本草、悦诗风吟以及自然堂。
4.2016年双11期间,在售商品数最多的是悦诗风吟,其次是佰草集,再次是欧莱雅。
5.2016年双11期间,热度前3的化妆品品牌依次是美宝莲、妮维雅以及自然堂。
6.2016年双11期间,在售化妆品的各品牌中,平均价格最高的是娇兰,最低的是美加净。
7.在参与2016年双11预售的化妆品数量中,占比最大的依次是倩碧、娇兰以及雅诗兰黛。

MySQL:2016年天猫双11化妆品销量数据分析相关推荐

  1. 8小时8分:2018年天猫双11交易额破1207亿元 已超2016年全天

    阿里巴巴天猫双11于今日凌晨正式打响.据双11实时交易数据显示,用时8时8分52秒,2018天猫双11成交额突破1207亿元,已超过2016年双11全天成交额. 以下数据由新浪科技根据现场交易大屏整理 ...

  2. 今年的天猫双11,和往年有什么不一样?

    2009年11月11日,第一个"双11"大促横空出世. 在随后的12年里,"双11"这场中国电商行业一年一度的盛宴,逐渐演变成为了全球消费者的购物狂欢季. 经历 ...

  3. 2018年天猫双11交易额超1000亿 比去年快7小时

    11月11日凌晨消息, 阿里巴巴天猫双11于今日凌晨正式打响.据双11实时交易数据显示,在开场的2分5秒,交易额超100亿元.1小时47分26秒,交易额突破1000亿元,而去年达到这一数字足足用了9个 ...

  4. 12点08分:2018年天猫双11交易额超1500亿!

    12点08分40秒,2018天猫双11成交额超1500亿. 2017年达到同一成交额用时21小时12分35秒,今年提前9个小时达成该数额. 更多阅读: 2018年天猫双11交易额超1000亿 比去年快 ...

  5. 人类商业大协同,天猫双11欲打造全球商业的“奥运会”

    电商平台的节日,成了全世界的狂欢 "也许春节老外不过,但是我想未来双11老外也一定要过." 2017年10月31日,在天猫双11全球狂欢节新闻发布会上,阿里巴巴集团CEO张勇如是说 ...

  6. 天猫双11第九年:史无前例的社会化大协同与全球商业未来

    发展至第九年,天猫双11已是当今世界最大的购物狂欢节.最大的线上博览会.最大的商业"超级工程",更是最广泛的全球化共振.在历年不断飞速攀升的最终交易额数字背后,天猫双11的意义早已 ...

  7. 全国产业带“回血”之战,为什么天猫双11是最佳主场?

    全国产业带打响"回血之战"! 外界看得见的是数以亿万计的包裹从四面八方被递送到海内外,看不见的是数字化的无形之手在背后推动着从研发.生产到交易的每个环节. 今年天猫"双1 ...

  8. 45分钟,411个中小品牌天猫双11实现新跨越

    CSDN从天猫获悉,今年天猫双11,有一批中小品牌实现跨越式增长.截至11月11日0点45分,已有411个去年成交额过百万的中小品牌,今年销售额突破千万:更有40个去年双11成交额千万级的品牌,在今年 ...

  9. 雷军又找到了一个蓝海:90分如何成为天猫双11预售最大黑马

    一场仅90分钟的谈判后,没人会想到,小米生态家族又一明星品牌诞生了--90分,涉足以箱包为核心的出行装备产品领域. 两年后的今天,90分用"霸榜"方式,正式宣告品牌的强势来袭.20 ...

最新文章

  1. ndarray维度认识及np.concatenate函数详解
  2. Android10.0 日志系统分析(一)-logd、logcat 指令说明、分类和属性-[Android取经之路]
  3. 数据结构:复杂度分析以及数据结构整体概览
  4. Java数据结构与算法:排序算法
  5. keepalived 构建主备mysql
  6. matlab读取txt数据绘图(python命令行传参)
  7. 新浪微博2-找到用户的accessToken
  8. c#_导出table功能
  9. rational rose 启动选择_Rational Rose打开问题
  10. runtime无法执行grep_如何使管道使用Runtime.exec()?
  11. php让符合条件的复选框选中,多条件查询(复选框条件)
  12. 《Web编程技术》学习笔记(一)
  13. Xshell 5 注册码
  14. Github访问和下载慢的解决与提升方案
  15. 我的小程序之个人所得税计算器
  16. 计算机视觉面试宝典--目标检测篇(二)
  17. reactrouter4路由钩子_React-Router4.x中文文档
  18. 博途软件中多重背景块的建立_TIA博途软件中创建多重背景函数块
  19. ICPR MTWI 2018 挑战赛三:网络图像的端到端文本检测和识别算法架构
  20. ERP系统的八大主要功能模块

热门文章

  1. Unable to open shape_predictor_68_face_landmarks.dat
  2. 读入一张图片,并且转化成灰度值
  3. 多个pdf如何快速合并成一个?
  4. 一篇文让你看懂NB-IoT、LoRa、eMTC、Sigfox及ZigBee的应用场景【转】
  5. 基于 EG6831 的无感 BLDC 控制方案
  6. 如何将android文件标题归中,Android复习题归纳总结
  7. 软件测试自学入门书籍
  8. ODU帧转OTU帧流程
  9. 将OpenGL渲染的结果保存为图片
  10. 解决String cannot be cast to java.util.List报错