吃货地图

作者:张哲
特别说明:本篇可视化分析报告数据来源为大众点评,没有特别、任何有针对性的分析目标,是作者为求职所特别准备的。
所有源码&图片:github.com/cyoutetsu/data_report


城市和地区

餐厅数量

直观来看,城市中餐厅的数量和城市的规模从感觉上有着正相关的关系。从地区来看,还是经济发达的地区有着明显的优势,例如环渤海地区、西南地区、长三角和珠三角地区。

如果用城市人口代表城市规模的话,从下面的散点图也可以很直观地看出二者是有明显正相关关系的。其中,我们可以看出,在传统四大一线城市“北上广深”中,上海和北京这两个直辖市还是处于超然地位的,其人口和餐厅数量都远远甩开第二梯队很远。另一个直辖市重庆以面积大、人口多(多达3000万)的方式也脱离了大部队,成为了“异常点”。

餐厅评价和价格

从上图中我们看到不管是全国平均情况(基准)还是四大地区各自的情况,他们之间口味、服务和环境的平均都非常类似,也就是说他们之间只有非常细微的差别。这样的情况显然没有意外,当今不管是人还是物的流动都十分的发达,基本不可能出现洼地。那么下面我们继续深究他们中的差别,把这三个要素的平均分进行加总,最终给出一个好坏高低来。

通过更加细致的研究发现:这四个地区基本都是在拖全国的后腿,在细微差别不大的前提下,环渤海地区和长三角地区水平一致,珠三角地区评分最低。


菜系

菜系分布

从下面的菜系类型占比图可以发现,除了第一,第二名之外的正餐,火锅居然是排第一。当然,博大精深的火锅要认真起来可以有重庆火锅、涮羊肉、牛肉火锅等等细分,但总的来说,火锅的确在全国人民心中有很重的分量啊。

接下来的正餐第二名居然是川菜,它在正统地方菜系里排名第一,如果再把火锅中的四川火锅的那部分算进川菜中,川菜的地位是可想而知啊,看来那句“少不入川”的名言真是不假,真安逸啊。

接下来的烧烤,海鲜,面馆在全国各地都有各自不同的诠释,自不多说。比较显眼的是西餐居然名列前茅,莫不是麦当劳,必胜客和肯德基?

主要地区的菜系分布

上图显示了四大主要经济地区的餐厅类型的状况,我们可以从中读出很多有趣的信息。

  • 最多样化的地区——珠三角

珠三角地区中“其他”类型的餐厅占比是四大地区中最大的,并且之前总结过的主要菜系的占比也远远低于平均水平,看来神秘的广东地区饮食结构复杂的传言是真的!

  • 最单一的地区——环渤海

这里的前五名的餐厅类型超过了全国平均,说明他们都在打拼,反倒在吃的上面并没有很钻研。

  • 面馆最多的地区–江南

由于本次并没有加入山西、陕西等大众认为面食最发达的地区,单单就看这里四个,之前说过,各地对面食有着不同的诠释,江南地区的面食肯定也有值得称道的地方。

川菜

目前川菜的普及度超过任何四大菜系,八大菜系,呈现星火燎原之势!没有什么地方是没有川菜的。


评价

不同餐厅类型的评价和价格

价格方面,不同菜系呈现出明显的阶梯状的特征,“梯队”的现象明显。对于评价来看,大致上呈现和价格正相关的趋势。下面挑出一些特别的菜式重点关注一下

首先就是日本料理,它虽然相对数量不多,但是不管是评价和价格都是一枝独秀,尤其是价格方面,远远甩开其菜式,和它隔壁韩国兄弟相比,吃一顿日本料理的钱可以拿来吃两顿韩国料理。

接下来是自助餐,价格很高,位于第二梯队,可是它的评价就不敢恭维了,猜测一下是不是质量实在是参差不齐导致的。

在图中绿色的第一档评价中的两个遗珠,分别是面包甜点和火锅,面包甜点这个状态并不意外;火锅,又是火锅,分布广泛、好吃还便宜,比日本料理便宜67%,是真·国菜!以后外国领导人来访华完全可以围一圈吃火锅嘛,继乒乓外交之后诞生出新的伟大外交形式————火锅外交!。

最后还是看一看川菜,性价比也是很高,评价和粤菜一样,但是其价格只有后者的59%。当我们把川菜用来招待各国元首的时候,完全可以想象吃辣子鸡丁他们拿着筷子扒拉辣椒找鸡块的画面。

主要城市的现状

从上面的地图看到,上海人民是真会玩啊。虽然之前在餐厅数量上和北京打了个平手,但是在人均消费和火爆程度(以点评个数衡量)来看,稳稳秒杀对手。点评数量是北京的1.6倍,人均价格比北京贵16%,比同为一线城市的深圳贵47.9%。深圳此时此刻不知是该哭还是该笑了。


连锁

我们在这里对全国所有餐厅的店名做了一个排名,找出了他们统一的名字,这样我们就可以看出什么样的连锁店在全国占据着主要的地位:

在上面的图中,字号越大,意味着它的分店数量越多。我们可以非常直观地看到,三大洋快餐占据着不可撼动的霸主地位。剩下的就是一些有实力开遍全国的小吃了,例如重庆小面、百味鸡等等。


上海专题

从之前的情形来看,国际大都市上海在全国真是鹤立鸡群,餐厅火爆,均价也高,现在就来看看仔细剖析一下这个地方。

均价、评价和评论数

我们不论从均价还是评论数来看,上海地区平均值被拉高的根本原因在于一些高到险些称为异常点的数据。如果抛去他们,剩下的地方和别的城市无异。我们在稍做一些预处理后,可以看到

上海最土豪餐厅:

全部都是外来的和尚好念经,尤其是来自东洋的和尚。这也符合日本菜精致,但是贵的要死的特点。

上海最火爆的餐厅:

既然说到火爆,还是本土的口味更被大家接受。其中不得不注意的一个现象就是明星开餐厅,薛之谦的上上谦凭借他在其他曝光度高的行业的混搭,最终对餐厅的经营还是起到了很大的作用的。

最后,我们再借助一下wordcloud工具,把上海餐厅火爆程度做一个直观地展现:

在上图中,字号越大代表被评论的次数越多,我们可以看到在上海的一些网红餐厅都有哪些了。

大众点评数据分析报告相关推荐

  1. 大众点评各城市热门餐厅数据爬虫抓取

    大众点评抓取 网址链接 http://www.dianping.com/shoplist/shopRank/pcChannelRankingV2?rankId=fce2e3a36450422b7fad ...

  2. python大众点评网实训报告中的参考文献_Python数据分析:大众点评数据进行选址...

    Python Python开发 Python语言 Python数据分析:大众点评数据进行选址 前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时 ...

  3. 大数据看美食 | 大众点评餐厅数据分析报告!

    就在上个周末,生活在朝阳区的我被一个世纪难题所困扰,那就是:中午吃什么?晚上吃什么?于是乎突发奇想,就想要统计一下朝阳区美食店的总体水平,哪些精品餐厅我还不知道,酒香不怕巷子深,我要把你们统统挖出来! ...

  4. 大众点评热门餐厅抓取与数据分析

    大众点评热门餐厅抓取与数据分析 大众点评抓取与分析  背景 有没有一种去其他城市旅游的时候想吃地方特色,但是却又不知道到该去哪里吃的感觉呢?反正我是有这种感觉,尤其是不想去其他城市却在泡面中度过,无法 ...

  5. 用Python获取大众点评上长沙口味虾店铺信息,并进行数据分析

    口味虾又叫麻辣小龙虾.在夏天的时候,邀上三五好友,来上几盘口味虾,搭配上啤酒,肥宅的生活就这么快乐的开始了,味道麻辣爽口,一口下去就想吃下一口!在湖南,没有吃上口味虾的夏天都是不完整的. 那么湖南的吃 ...

  6. 为了部落 来自艾泽拉斯勇士的python爬虫学习心得 爬取大众点评上的各种美食数据并进行数据分析

    为了希尔瓦娜斯 第一个爬虫程序 csgo枪械数据 先上代码 基本思想 问题1 问题2 爬取大众点评 URL分析 第一个难题 生成csv文件以及pandas库 matplotlib.pyplot库 K- ...

  7. mysql 文本 挖掘_GitHub - myseve/dianping_textmining: 大众点评评论文本挖掘,包括点评数据爬取、数据清洗入库、数据分析、评论情感分析等的完整挖掘项目...

    大众点评评论文本挖掘 [TOC] 一.爬虫 整体思路 爬取大众点评十大热门糖水店的评论,爬取网页后从html页面中把需要的字段信息(顾客id.评论时间.评分.评论内容.口味.环境.服务.店铺ID)提取 ...

  8. mysql 文本 挖掘_GitHub - cwff520/dianping_textmining: 大众点评评论文本挖掘,包括点评数据爬取、数据清洗入库、数据分析、评论情感分析等的完整挖掘项目...

    大众点评评论文本挖掘 [TOC] 一.爬虫 整体思路 爬取大众点评十大热门糖水店的评论,爬取网页后从html页面中把需要的字段信息(顾客id.评论时间.评分.评论内容.口味.环境.服务.店铺ID)提取 ...

  9. mysql 文本挖掘_GitHub - HuiHuiT/dianping_textmining: 大众点评评论文本挖掘,包括点评数据爬取、数据清洗入库、数据分析、评论情感分析等的完整挖掘项目...

    大众点评评论文本挖掘 [TOC] 一.爬虫 整体思路 爬取大众点评十大热门糖水店的评论,爬取网页后从html页面中把需要的字段信息(顾客id.评论时间.评分.评论内容.口味.环境.服务.店铺ID)提取 ...

最新文章

  1. 程序模拟抽奖流程图_一道与联欢会相关的概率统计题目的模拟仿真
  2. 阿里平头哥发布AIoT芯片平台“无剑”,可将芯片设计成本降低50%
  3. The application could not be verified
  4. 估价范围还没有生产式的物料帐薄
  5. boost::filesystem::path的用法测试程序
  6. 方差为什么用平方不用绝对值_为什么炖鸡汤,人们喜欢用母鸡而不用公鸡?原来差别这么大!...
  7. How is HashMap return type handled to be converted to a json string
  8. python 日志内容提取
  9. JAVA script 循环 图片_深入分析JavaScript 事件循环(Event Loop)
  10. js 阻止冒泡事件和默认事件
  11. flex连接mysql,flex对数据库(sqlite)的操作
  12. Django(四):模型层Model
  13. 浅谈核桃的栽培技术与种植管理方法
  14. 51单片机4种流水灯
  15. android 使用流量监控,android流量监控
  16. 【saltstack学习系列之四】saltstack的returner
  17. Decoda1.17重编译实录
  18. OSPF协议介绍➌(认证、汇总扩展、LSDB的保护特性、缺省路由、附录E、选路规则、SPF算法、NP+E位、FA地址)
  19. 2月书讯(下)| 新年到,新书到!
  20. 世坤投资大学:欲提供数据科学硕士学位的对冲基金

热门文章

  1. 怎么在线给pdf加盖电子公章
  2. 文件在另一个程序中打开,无法删除~【删除文件被占用问题】(保姆级教程,五种解决办法~)
  3. 计算机组装与维护集体备课,浅谈集体备课
  4. 树莓派+PHP+Mairadb数据库读取DHT11
  5. BT网站关了,正版电影数字发行在线收费下载 的机会?
  6. APS计划软件助纺织企业降低成本,提升效益
  7. 孩子不上学在家玩游戏打骂父母
  8. 名帖176 苏轼 行书《杜甫堂成诗卷》
  9. 怎么制作一个笔试题库?会计笔试题库中的题型分析?
  10. 【史上最强】据说是气死了99名老师的作文