作者 | 放开那个猕猴桃

来源:知乎,转载已获授权。

缘起

我在杭州有位朋友,提到有家做社交的电商很火,叫拼多多,我没有在意,直到有一天,我居然在电视上看到了它的广告,广告画面活蹦乱跳,余音绕梁,我惊呆了,想知道这是何方YL,不,何方神圣,网上搜了下,流传着各种版本,比如月GMV超过400亿啦,已经威胁到京东淘宝啦,等。

辣么,怎么样才能知道拼多多的这些信息呢?比如,拼多多到底有多少在售商品,卖了多少钱?不单单是拼多多的投资人,也许淘宝京东,也想知道。

我有个简单的想法,不一定对,就是爬下拼多多的商品条目,这些条目至少有分类,价格,已出售数量等信息,做一个简单的加法,是不是就可以得到GMV了呢?

当然,缺点也很明显,就是由于第一次获取数据,只能得到这个时间点的切面信息,其他的信息, 比如每日每周每月的数据,要持续的获取才能得到。

当然,我们先走第一步,开个头。现在,我们就从一个切面来窥探下。

我们获取了多少商品条目?

49.78万,大约50万条。这些数据全不全,肯定不全,但是基本上覆盖了拼多多的绝大部分在售商品,再退一步,数据的量级应该是没错的(数据获取时间:2018-04-15)。

这些商品总共卖出了多少钱?

50万条商品,每件商品有不同的SKU,比如某个店家的芒果,下面有4个SKU,5斤的小的拼单价20元,5斤的大的30元, 8斤的小的40元,8斤的大的50元, 分别卖出了400份,300份,200份,100份,那么这个商品总销售额就是400*20 + 300*30+ 200*40+ 100*50 = 30000元。

如此,我们就可以计算出总计50万商品的销售额。

288亿。

我对电商是个外行,一般商品上面的“已卖出9527件”,问下各位电商业界人士,这个是当月的销售数量吗?如果是的话,那288亿就是月GMV,考虑到本月只过去一半,辣么,传言的“拼多多月GMV超过400亿”,或许,空穴不来风。

288亿是一个什么概念呢,我们搜索了京东财报的公开新闻:

京东2017年GMV接近1.3万亿,净利润50亿元。

可以估计去年京东的月均GMV大概是1100亿,电商的GMV同比可达50%+增长,胡乱估计京东2018月GMV大概1500亿,辣么,拼多多的GMV大约为京东的三分之一。

这个, 还是有点吃惊的啊。

销售额前十的品类是哪些?

了解一个电商平台销售额前几位的品类,有助于判断它的竞争优势,比如电器数码等产品之于京东,服饰箱包之于淘宝,图书音像之于当当。

拼多多的主打品类是什么呢?

电商喜欢将商品分为三级品类,比如食品-水果-猕猴桃。 以下我们列出一级类目和三级类目排名前十的数据。

全部一级品类成交额:

一级类目销售额前10的品类:

前三名分别是食品,母婴,女装。成交额分别是40亿,31亿,27亿。厉害了。

来看看前三名的销售额占所有36个一级类目的成交额比例,足足三分之一强。

三级类目销售额前10的品类:

第一名是抽纸,卖了5个多亿!

我有点好奇,想知道是什么牌子的抽纸卖了这么多呢?同时也为了验证数据的准确性,从数据库中找到了(历史)销量最高的抽纸,销量508万。

根据名字,手动在拼多多APP找到了这款产品,它的名字也许你没有听过,是这样的:

嗯,数据是正确的(这2天又多了2万,手机传过来的,这图怎么这么大)。

作为对比, 看了京东销量最高的单品,维达是320多万,和拼多多排名第二的,一个名叫“初采”的抽纸销量(343万)差不多。

销售量前二十的商品是哪些?

商品的销售量代表了人气,当然,也许一个商品有人会买多份,无论如何,我们可以从中看出拼多多最多客户购买的产品是什么:

第一名还是抽纸,第二名不可描述,第三名伞(希望大家能够点击查看原图,否则压缩的看不清了啊)。后面还有几个也是抽纸,嗯,我就不懂了,为什么这么多抽纸,拼多多主要就是卖纸的?

销量前二十的商品,销售量都在200万以上。给我的感觉,有点类似于超市,更确切地说,有点像杂货铺,或者,类似于小时候村头的小卖部,以实用的生活用品为主,实在,方便,实惠。

商品一般都卖什么价格?什么价格区间的商品销量最好?

那么下一个,你可能要问了,约50万的商品,大部分在什么价格区间呢,价格和销量有什么关系?

我们看看下面的商品数量-价格区间:

从商品数量来说, 超过一半(约57%)的商品价格介于0~50之间,大部分(约75%)的商品价格介于0~100元。

从统计数据可以发现,96.5%的商品价格介于1元到1000元之间,我们剔除这些商品(让图片没有那么尖锐难看),做出了如下价格-销量的点图:

横轴代表价格(单位:元),纵轴代表销量(单位:千)点越高,说明销量越大。还是很尖锐,看起来价格超过200就很平了啊,再看一个价格介于1~200的点图:

请点击查看原图,这样更清晰。我们从图中可以看到,销量过100万的商品,价格低于50。除了有2个零星的点,价格在100左右,销量也在100万上下。

需要说明的是,销量随着价格锐减,这是很正常的,京东淘宝做个点图估计也差不多。

再细化一点可以吗?

可以的。食品是销售额第一的品类,衣食住行,不意外,食品种类繁多,辣么,我们可能要问,从成交总额来说,排名前十的三级食品品类是哪些呢?分别占比多少?

第一名坚果炒货(成交额5亿),第二名白酒(2.8亿),第三名方便速食(2.5亿),前十名的三级类目成交额都过亿元。

坚果炒货销量前10的商品:

憨豆熊……厉害了。第二名是康梦,想起小时候吃过一款零食,康辉,不知道现在还在不在。

白酒呢,很好奇。

五粮液茅台?不过仔细一看不是茅台,是茅台镇的酒,所以。拼多多上面白酒卖的这么多,还是有点意外的。

什么水果在拼多多最受欢迎?

我注意到,水果生鲜是作为一个单独的一类品类存在的,生鲜水果是第二品类,辣么,三级目录中,哪一种水果最受欢迎呢?

芒果第一!请看图(芒果。那就给个黄色吧),第二名是苹果,第三名是奇异果(就是猕猴桃吧)

从销售量来说,芒果确实也是当之无愧的第一名,关键词“越南进口”非常显眼。如此看来,拼多多为跨境贸易也做了不少贡献。

多余的话

在这个万众创新,消费升级的年代,拼多多这样的社交电商的出现,在满足普通人民物美价廉需求方面,大获成功,让我有种错觉,难道这代表了我们的社会反而陷入了消费降级的陷阱吗?

因为拼多多的这些数据, 我想起几年前读过的一位名为三浦展的作者写的一本书:《下流社会》,这里的下流社会并不是贬义,只是探讨日本社会的社会消费,阶层团块。

“下流社会”这个术语一经在日本出现,立即引爆讨论。因为社会“向下流动”的趋势正在世界悄然成形,日美欧曾引以为傲的中产阶层正在消失,出现“上流”与“下流”的两极分化。

年轻一代源源不断加入的“下流社会”,其最大的特征并不仅仅是低收入,更在于沟通能力、生活能力、工作意愿、学习意愿、消费意愿等的全面下降,也可以说是“对全盘人生热情低下”。社会下沉的拉力愈来愈大,当全球社会纷纷向下流动,中国,能预防吗?

但是,拼多多的兴起也许是另外的情况,因为中国太大了,也许真的是消费升级,只是不是一二线城市居民的消费升级呢?

拼多多销量最好的单品是什么?抽纸。

这让我想起,小时候在农村,去洗手间方便,额说错了,是去茅房如厕,那时候哪里有什么清风维达和初采啊,就是用过的书本练习册什么的。现在大家生活水平提高了,开始用抽纸卷筒纸,看,这,算不算消费升级呢?

征稿啦

CSDN 公众号秉持着「与千万技术人共成长」理念,不仅以「极客头条」、「畅言」栏目在第一时间以技术人的独特视角描述技术人关心的行业焦点事件,更有「技术头条」专栏,深度解读行业内的热门技术与场景应用,让所有的开发者紧跟技术潮流,保持警醒的技术嗅觉,对行业趋势、技术有更为全面的认知。

如果你有优质的文章,或是行业热点事件、技术趋势的真知灼见,或是深度的应用实践、场景方案等的新见解,欢迎联系 CSDN 投稿,联系方式:微信(guorui_1118,请备注投稿+姓名+公司职位),邮箱(guorui@csdn.net)。

————— 推荐阅读 —————

程序员分析了 50 万条拼多多商品数据,告诉你到底是消费升级还是降级!相关推荐

  1. 我们分析了50万条拼多多商品数据,告诉你到底是消费升级还是降级?

    作者:放开那个猕猴桃 来源:人工智能与大数据生活 转自:知乎,恋习Python 一.缘起 我在杭州有位朋友,提到有家做社交的电商很火,叫拼多多,我没有在意,直到有一天,我居然在电视上看到了它的广告,广 ...

  2. 大数据分析了50万条拼多多商品数据, 得出了这样的结论

    一.缘起 我在杭州有位朋友,提到有家做社交的电商很火,叫拼多多,我没有在意,直到有一天,我居然在电视上看到了它的广告,广告画面活蹦乱跳,余音绕梁,我惊呆了,想知道这是何方YL,不,何方神圣,网上搜了下 ...

  3. 拼多多商品数据如何通过api接口获取

    要从拼多多获取商品数据,可以使用拼多多提供的API接口.首先需要注册一个拼多多开放平台的开发者账号,然后创建一个应用程序,获取应用程序的app_id和app_secret,以在API请求中进行身份验证 ...

  4. 程序员年入50万,我们该如何努力达到这个目标?

    先说明,这里是指税后.年收入50万在上海算多吗?比上不足,比下有余. 不过在上海达到这个水平,至少可以说是能达到财务自由了吧.况且,根据马太效应的说法,和年入20万到50万这个增加阶段相比,年入50万 ...

  5. 程序员突破年薪50万的唯一门坎-文档写作能力(一)

    第一篇算是一个导论 不知道大家有没有经常回溯.追溯或者抱怨过这样的内容. 第一种抱怨:工作了4年.5年,晋升不明显,最最多做到一个小Team Leader,管了3-5个人.跳来跳去工资增涨只不过多个2 ...

  6. 985程序员4年50万仍被二本学医亲戚酸:学会这3点,才能笑到最后

    不知道从什么时候开始,吃香的程序员行业进入了寒冬季,几乎所有人都说干程序员没有什么前途,反正35岁也要被辞,到时候说不定只能去当送外卖的活,别看现在挣得多,其实没啥前途. 很多程序员因为这些话受到了一 ...

  7. 程序员爬取 3 万条评论,《长安十二时辰》槽点大揭秘!

    作者 | Alfred Wu 责编 | 伍杏玲 本文经授权转载自Alfred数据室(ID:Alfred_Lab) 最近,悄悄上线的<长安十二时辰>在朋友圈被吹爆了:年度最佳古装剧.服道化精 ...

  8. python黑客库长安十二时辰 更新_程序员爬取 3 万条评论,《长安十二时辰》槽点大揭秘!...

    该剧总体评价如何? 优酷给<长安十二时辰>打出了8.8的高分(首播时为9.0分).该剧在豆瓣.IMDB.时光网等平台分别收获了8.6.8.5.8.4分,这足以说明该剧总体评价还是不错的. ...

  9. 2023年疫情开放,国内程序员薪资涨了还是跌了?大数据告诉你答案

    自从疫情开放,国内各个行业都开始有复苏的迹象,尤其是旅游行业更是空前暴涨,那么互联网行业如何? 有人说今年好找工作多了,有人说依然是内卷得一塌糊涂,那么今年开春以来,各个岗位的程序员工资到底如何? 我 ...

最新文章

  1. 数据库架构的升级和变更
  2. PAT L2-005 集合相似度
  3. 员工(类的多态性实验)
  4. 简述用UCenter整合第三方应用程序
  5. easyui combobox 左匹配模糊查询
  6. php运行时输出,在PHP中运行具有实时输出的过程
  7. 配置web.xml和glassfish容器实现javaEE表单验证
  8. iphone core animation教程
  9. 健康驿站房间线上预约系统网站分析
  10. java字符串练习题_java练习题——字符串
  11. 用计算机弹生僻字乐谱,生僻字 E调(拇指琴卡林巴琴弹奏谱)
  12. php公众号回复接口,微信公众平台开发接口教程之公众账号自定义回复功能
  13. 【重磅】云栖社区2017年度内容特辑
  14. 【C++】宏定义函数指针类型
  15. Caffeine Eviction策略
  16. python在手机使用webdriver.chromns_Selenium +Chrome浏览器如何模拟手机操作
  17. 怎样判断驱动程序是否有通过WHQL认证获得微软数字签名
  18. fastAPI使用mongoDB
  19. obj文件、mtl文件结构说明
  20. 计算机应用基础第四版答案周南岳,计算机应用基础第周南岳win+office期末复习及答案.docx...

热门文章

  1. AttributeError: type object 'h5py.h5.H5PYConfig' has no attribute '__reduce_
  2. 【QT】QT从零入门教程(十六):QSS样式表
  3. 中国接种环行业市场供需与战略研究报告
  4. 电力电容器行业调研报告 - 市场现状分析与发展前景预测(2021-2027年)
  5. sql相同顺序法和一次封锁法_【数据库】面试题汇总
  6. Python菜鸟入门:day18编程学习
  7. React 的开发成本太高了?
  8. API 应该享受版权保护吗?
  9. HarmonyOS 生态最重的拼图,手机开发者 Beta 版终于到来
  10. 滴滴 AI Labs 负责人叶杰平因个人原因即将离职!CTO 张博接任