Python爬取上万条大众点评数据,解读一线快餐品牌背后的秘密
中国的快餐市场竞争一直都很激烈,关于各种品牌江湖上也流传着各种神奇的故事,那么你知道
一线城市最多的快餐品牌是哪家?
沙县小吃真的是中国餐饮巨头吗?
每一家肯德基边上都有一家麦当劳是不是真的?
星巴克VS瑞幸咖啡,谁的热度更高?
本文使用Python爬取了上万条大众点评商家数据,告诉你答案!
一线城市快餐品牌店铺数量大PK
首先我们来看一下一线城市中沙县小吃、兰州拉面、星巴克、瑞幸咖啡、肯德基、麦当劳的店铺数量分布情况
从上方的图中可以看到,沙县小吃在上海、广州、深圳都占有最多的市场,而北京则是兰州拉面拥有最多的店铺。并且在四个一线城市中,沙县小吃加兰州拉面都占有了70%以上的市场,妥妥的餐饮巨头!
除去沙县小吃和兰州拉面,我们继续来看麦当劳和肯德基这两家西式快餐店,可以看到,这两家快餐店在四个一点城市中的店铺数量基本持平,果然有肯德基的地方就有麦当劳并非传言!
最后来看看星巴克和瑞幸这两家咖啡店,我们可以发现,在上海,光星巴克的店铺数量就超越了其余任何一个城市的两家咖啡店总和!看来魔都星巴克门店数量全球第一也不是在吹牛!
肯德基 VS 麦当劳,真的那么近吗?
江湖上一直传言有肯德基的地方就有麦当劳,那么事实如此吗?我们爬取一线城市大众点评搜索肯德基和麦当劳关键字下的全部搜索页面,并将地址进行可视化如下图
我们可以看到,不论在哪个城市,肯德基和麦当劳的店铺位置重叠度都非常高,就连在上海的崇明岛上,两家也有开在一起的店铺!
所以当你看到一家肯德基店时,大胆的往前走,一定能再找到一家麦当劳[狗头]!
而其他品牌,比如上海市的瑞幸咖啡就没有插手崇明区,而在广州市兰州拉面占领更多市中心店铺,外围区域更多的则是沙县小吃。
沙县小吃 VS 兰州拉面,谁的价格更低?
沙县小吃和兰州拉面,作为市场占比最高的快餐品牌,与其低廉的价格离不开关系,那么在一线城市中,他们的价格是怎样的?我们来看看
以北京为例,我们可以看到,虽然是市场占有第一第二的快餐店铺,但是其价格差距却是明显的,在北京一碗兰州拉面可以整两顿沙县小吃了,难怪三和大神最爱沙县大酒店。
进一步,我们将全部一线城市的快餐品牌均价进行可视化。
从图中我们可以看出,不论哪个快餐,北京的店铺均价基本是最高的,而广州的价格大多是最低的,同为一线城市,部分快餐品牌的人均价格竟然相差一倍(兰州拉面),是北京的兰州拉面中的牛肉更厚吗?
另外值得关注的是,星巴克的均价是这六个品牌中最高的一家,而作为其竞争对手的瑞幸咖啡价格则低了近一半,当然看到我瑞幸咖啡卡包中的优惠券还是能够理解的,不过一杯星巴克约等于三份沙县小吃,你怎么选?
星巴克 VS 瑞幸咖啡,谁的热度更高?
从上一节的结果来看,星巴克的均价比瑞幸高出近一倍,那么是贵一点星巴克受欢迎还是优惠券多多的瑞幸咖啡更得人心,我们以店铺下面的评价数量作为店铺热度,对数据进行可视化
从上面的散点图中我们可以看到,在四个一线城市中,大多数瑞幸咖啡的店铺评价数量集中在0-500,而星巴克店铺的评价数量整体略高一点,所以并不是价格高就没有人喝,当然在很多情况下,去星巴克不是为了喝咖啡
不过在评价大于2000的店铺数量上,瑞幸咖啡则占有优势,说明瑞幸咖啡也是有相当一批忠实粉丝!
那么星巴克和瑞幸咖啡,你更中意哪个?
本文的分享就到这里,因篇幅原因相关技术细节不再讲解,如果你喜欢本文或者想了解如何爬取大众点评,如何进行数据可视化的话,欢迎给本文来一波三连(点赞,在看,转发)支持一下,我会在后续的文章以及我的公众号「早起Python」中进行技术拆解!
Python爬取上万条大众点评数据,解读一线快餐品牌背后的秘密相关推荐
- 实战▍Python爬取3w条游戏评分数据,看看哪款最热门?
图| 战争前线游戏原画 本文作者| 量化小白H 本文为投稿,36大数据已获发布授权 36大数据推荐 实战项目 本文爬取了豆瓣游戏网站上所有可见的游戏评分数据进行分析,全文包括以下几个部分: 数据获 ...
- Python 爬取 201865 条《隐秘的角落》弹幕数据,发现看剧不如爬山?
Python 爬取 201865 条<隐秘的角落>弹幕数据,发现看剧不如爬山? 本文不涉及剧透!请放心食用 最近又火了一步国产剧:<隐秘的角落> 如果你没看过,那可能会对朋友圈 ...
- Python 爬取 201865 条《隐秘的角落》弹幕,发现看剧不如爬山?
作者 | 朱小五 责编 | 屠敏 封图 | CSDN 付费下载自东方 IC 最近又火了一部国产剧:<隐秘的角落>. 如果你没看过,那可能会对朋友圈里大家说的"一起去爬山" ...
- 如何使用python编程抢京东优惠券 知乎_学好Python爬取京东知乎价值数据
原标题:学好Python爬取京东知乎价值数据 Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这 ...
- 使用python爬取BOSS直聘岗位数据并做可视化(Boss直聘对网页做了一些修改,现在的代码已经不能用了)
使用python爬取BOSS直聘岗位数据并做可视化 结果展示 首页 岗位信息 岗位详情 薪资表 学历需求 公司排名 岗位关键词 福利关键词 代码展示 爬虫代码 一.导入库 二.爬取数据 1.爬取数据代 ...
- python爬取火车票网的时刻表数据
python爬取火车票网的时刻表数据 导包 import re,requests,datetime,time,json from prettytable import PrettyTable from ...
- 通过爬取天猫商品评论实例分析Python爬取ajax动态生成的数据
本文主要通过爬取天猫商品kindle的评论为例来说明利用python爬取ajax动态生成的数据的方式,本文使用的工具如下: 工具 chrome浏览器[寻找评论的动态链接] python3.5[执行代码 ...
- 练习:使用Python爬取COVID-19疫情国内当日数据
练习:使用Python爬取COVID-19疫情国内当日数据 推荐公众号:数据酷客 (里面有超详细的教程) 代码来源数据酷客公众号教程 URL它是Uniform Resource Locator的缩写, ...
- python爬取股票信息_利用Python爬取网易上证所有股票数据(代码
利用Python爬取网易上证所有股票数据(代码 发布时间:2018-04-14 17:30, 浏览次数:1261 , 标签: Python import urllib.request import r ...
最新文章
- 带进度条的ASP无组件断点续传下载代码
- 31个好用的 Python 字符串方法,建议收藏!
- servlet第2讲(下集)----创建servlet实例(继承HttpServlet)
- Java 正则表达式中为什么反斜杠“\“需要用“\\\\”表示
- CODE[VS] 1275有鱼的声音 2012年CCC加拿大高中生信息学奥赛
- myeclipse 没有任何问题,可偏偏还报这错。
- 《javaScript100例|02》超级经典一套鼠标控制左右滚动图片带自动翻滚
- sqlwarning mysql_mysql提示[Warning] Invalid (old?) table or database name问题的解决方法
- SNMP客户端工具MIB Browser
- 2017.5.8 文化之旅 思考记录
- linux NAND驱动之一:内核中的NAND代码布局
- WPF Name与x:Name 使用
- HTML5期末大作业:我的家乡网站设计4
- php 获取客户端IP
- 有高项(软考)证书,考PMP还要报培训班吗?
- 大数据线性回归预测学生成绩
- OC高级foundation框架类以及数据的简单存储
- 不租云服务,也能自建网站
- Verizon收购雅虎:中外电信运营商坚持造梦内容产业
- 服务器托管和服务器租用的区别