注:数据来源使用八爪鱼采集器采集京东商城中笔记本的数据,共采集12030条,去除重复、无用数据后剩余5968条,本文主要分析标题、品牌、价格、评价数量。文末有源数据地址,小鑫欢迎各位朋友一起交流(E-mail:rockyxin@rockyxin.com)


第一个问题:哪个品牌的笔记本数量最多?

电子产品的品牌向来众多,国内的、国外的、有名的、山寨的……

科技飞速发展的现代,老牌笔记本厂商是否能稳坐江山?新秀们的实力又怎么样呢?

一张图解密笔记本品牌的格局。

可以看出,戴尔以微弱优势拿得头筹,但这个头筹拿得可不稳。联想单枪匹马紧随其后,算上ThinkPad,可以说实力碾压戴尔及其他一众厂商。不得不说,联想在数量上还是具有统治地位的。

处在第二梯队的是华硕、惠普、宏碁等大厂商,毕竟深耕这块土地多年,口碑不错,支持者众多。

紧接着是三星和苹果两家顶级大公司,当然,笔记本只是他们的一个产品,我们更为熟悉的还是他们的手机产品。

前十名的最后两位都是国产品牌,简单搜索了一下这个新晋新秀-麦本本,2013年创立的品牌,曾是淘宝单品销量第一的笔记本品牌。

自从去年小米发布笔记本,到现在为止都没有怎么关注,现在突然看到,前十名的榜单上有小米,颇为诧异,粉丝经济的力量还是不容小觑的。

后面的几个品牌,只有神舟、清华同方、机械革命有听说过,其他的几个品牌都比较低调。需要注意的是,那个牌子真的是彗星人,不是外星人。在小鑫采集的数据中,只有7条是外星人的,因此没上榜。

上面这份榜单仅仅根据品牌的数量来排名的。

除了数量之外,最值得关注的当然是价格。

第二个问题,哪个品牌的笔记本最贵?

在采集的数据中,很多价格标签的写法是这样的:3000-3400元,公(jian)平(dan)起(cu)见(bao),直接采用平均价3200元。这样处理,或多或少都会存在一点偏差,但本文主要的目的在于参考,各位看官切勿认真。

这里,对于源数据进行了一些筛选,对于那些数量特别少的数据,求平均数显得不太公平,因此,数量小于10的,比如微星8个,外星人7个。

因此,价格高的外星人榜上无名。

可以看得出来,过万的品牌只有苹果一个,其次就是6000-10000,一共有三个品牌。

最多的区间还是3900-5000多,一共有九个,大部分的大厂商也多在这个区间。

第三个问题,哪些品牌卖的最好?

不管数量多少,也不管价格高低,卖得好,才是硬道理,用户喜欢才是最重要的。

所以,接下来,就看看哪些品牌卖的最好。

在某种程度上,实际卖出的数量应该是略大于评价数量的。

因此,在这里,将评价数等价于销量,各位看官,看个大概就行。

联想在市场的占有率确实是个大头,上面可以看出,联想的平均价格在4676,一个很中规中矩的段位。

其次的第二梯队,华硕和戴尔两个巨头,相差无几。

第三梯队的也是非常有名的品牌,惠普、ThinkPad、苹果。

前十名中,除了机械革命,其他的都是大牌的厂商,在笔记本这一块做的时间久,市场渗透高。

好奇的小鑫,搜索了一下机械革命,专门做游戏笔记本,2014年成立的年轻品牌,才仅仅3年,就可以挤进厂商云集的前十,不简单啊。

分析到这里,似乎就没啥可以说的了,小鑫突然想看一下,价格的高低是否会影响到销量?

第四个问题,价格与销量,什么关系?

在看数据之前呢,小鑫就猜测,价格与销量的分布情况,应该呈现一种正态分布的样子。

那么,具体是怎样的呢?咱们来看一看。

这是所有品牌一起的汇总数据,因此,可能会存在受一些品牌的影响。

而且,这个图表,为了容纳更多数据点,纵横坐标颠倒了位置。

下面,咱们将横坐标设置为价格,并且选取“联想”这一种品牌的所有数据,来进行观察。毕竟联想的销量最大。

可见,并不是完美的正态分布,但是在3000-8000的区间内,大致满足。在某个价格区间内,销量很高,然后越往两边分散,销量更低。明显可以看出,价格升高对销量的影响,比价格降低的影响多大。在7000左右出现销量最高点,然后就出现断崖式的降落。

最后

这篇文章仅仅是小鑫发现之前收集的数据中,有这么一个数据,然后就拿出来看看,因为数据的维度较少,所以得出的结论也不是很多,各位看官做个参考就行,买笔记本这事,还是得看个人。单纯凭借一两个因素去决定,肯定不是个明智的选择。

最后,希望跟各位朋友交流学习。E-mail:rockyxin@rockyxin.com

【END】


原始数据地址: http://pan.baidu.com/s/1qYToRjm

密码: 5i99

数据分析京东笔记本电脑相关推荐

  1. Python爬取京东笔记本电脑,来看看那个牌子最棒

    @图片自制by小si 一.前言 二.知识要求三.过程分析1.观察主页面和每个电脑界面的网址2.寻找每个电脑的id3.找到存放电脑的价格和评论数的信息4.爬取信息的思路四.urllib模块爬取京东笔记本 ...

  2. 爬取京东笔记本电脑销量榜每件商品详情页url,并存入云服务器中的mysql库

    文章目录 一.目的分析 二.爬取页面商品所有详情页链接 1.爬取href链接 2.将数据存入数据库 完整代码: 三.多线程优化版已完成 (多线程优化)爬取京东笔记本电脑销量榜data-sku(商品id ...

  3. python基于scrapy爬取京东笔记本电脑数据并进行简单处理和分析

    这篇文章主要介绍了python基于scrapy爬取京东笔记本电脑数据并进行简单处理和分析的实例,帮助大家更好的理解和学习使用python.感兴趣的朋友可以了解下 一.环境准备 python3.8.3 ...

  4. 用Python实现爬虫爬取京东笔记本电脑图片

    最近需要从网上搜集一些数据,于是花了几个小时把爬虫学了一下.其实我在两年前的一个简单的站内搜索引擎的实现已经涉及到了简单的爬虫,不过那时候老想着偷懒,加上山大新闻网的设计又很好爬,所以当时写得很low ...

  5. 网络爬虫---用urllib模块爬取京东笔记本电脑的数据、并对其做一个可视化

    用urllib模块爬取京东笔记本电脑的数据.并对其做一个可视化 文章目录 用urllib模块爬取京东笔记本电脑的数据.并对其做一个可视化 一.前言 二.知识要求 三.过程分析 1.观察主页面和每个电脑 ...

  6. Python爬取京东笔记本电脑,来看看那个牌子最棒!

    一.前言 二.知识要求三.过程分析1.观察主页面和每个电脑界面的网址2.寻找每个电脑的id3.找到存放电脑的价格和评论数的信息4.爬取信息的思路四.urllib模块爬取京东笔记本电脑的数据.并对其做一 ...

  7. (多线程优化)爬取京东笔记本电脑销量榜data-sku(商品id),并存入云服务器中的mysql库(爬取时间较上一版提升十多倍)

    文章目录 前言 一.优化内容 1.cromeOptions()加载优化 2.ThreadPool()中的pool.map()多线程优化 二.完整代码 三.运行效果截图 前言 本文为上一篇爬虫文章的多线 ...

  8. python 京东_Python数据分析-京东订单数据分析实战

    本次数据来源于京东,类目为大家电-家用电器-冰箱,抽取2020年5月25日10%数据,数据量为 70k+,在 jupyer notebook 内进行分析. 数据文件: 链接:迅雷云盘:提取码:ezQq ...

  9. scrapy爬取京东笔记本电脑数据并进行简单处理和分析

    京东爬虫 一.环境准备 二.问题分析 三.spider 三.item 四.setting 五.pipelines 六.middlewares 七.使用jupyter进行简单的处理和分析 一.环境准备 ...

最新文章

  1. 虚拟化部署之灵活应用Hyper-V快照
  2. 新手必看的编程介绍,帮你推荐学习方案!
  3. 量子计算机 模拟,新量子算法将量子模拟器变成量子计算机,可以进行量子计算...
  4. C#中字符“.NET研究”串的内存分配与驻留池
  5. codeforces71A-C语言解题报告
  6. timus 1260. Nudnik Photographer 动态规划
  7. 弹出窗口刷新它的父页面后。出现不重新发送信息,则无法刷新网页
  8. Adaptive Feature Recombination and Recalibration for Semantic Segmentation: Application to Brain Tum
  9. 常见容错机制:failfast、failsafe、failover、failback
  10. iir滤波器的基本网络结构_(IIR)滤波器的基本结构-Read.ppt
  11. 操作系统学习 - 逻辑地址转物理地址
  12. html 让页脚始终底部,CSS + DIV 让页脚始终保持在页面底部
  13. 智力题、推理判断题、数量关系题(三)
  14. 经历 成长——致逝去的时光
  15. 编码技巧——全局异常捕获统一的返回体业务异常
  16. Linux发行版幽灵漏洞的backport
  17. 什么是自律性?如何提高自律性?
  18. Mybatis复杂查询环境
  19. 红色石头-通过Sina SAE中级开发者审核
  20. 素民党的故事 (01) 什么是素民党

热门文章

  1. 理一下CUDA、CUDA toolkit和NVCC
  2. Struts2通配符映射/Struts action name=/*/* method={2} class=com.jxc.action.{1}Action result
  3. Mac系统下docker容器无法使用--net host共享宿主机端口的解决方案
  4. 聚类评估算法-轮廓系数(Silhouette Coefficient )
  5. 软件研发之道:微软开发团队的经验法则
  6. CF 371D Vessels 【并查集】
  7. GSM系统信令接续流程
  8. 深度学习的时间序列分类
  9. 2022秋季 电影&书单
  10. 数据系统架构-6.BI数据展示平台