大家好,今天的视频是关于广州市的美食数据可视化分析,对美食的整体分布情况做了一个展示,加上一些美食推荐。我们从四个角度展示我们的数据,地理位置,商圈,得分,美食推荐。文章的重点在于(二)部分,该怎么讲好一个可视化的故事,同时该如何分析图中的insight。

(一)数据清洗

拿到的数据是两个主表和地理位置表

经过简单清洗后的数据如下所示:

清洗的过程主要包含表格合并,创建一些新字段,简单对文本进行手工清洗。

(二)可视化思路

首先是我们想讲一个怎么样的故事,在pre的过程中,你的核心故事线是什么,不要为了展示而展示,这个决定了你的展示的核心。

我简单提一个思路,作为城市展示宣传中的美食宣传(就是一个整体),消费者进餐指南,或者更有高端的从中分析美食行业进入的咨询报告(更像一份商业报告)。我水平有限,就做最简单的第一个,或者说有一点第一个和第二个的杂糅hhh。

原始的字段有这些“名称 评论数 人均价格 菜系 商圈 地址 推荐1 推荐2 推荐3 口味评分 环境评分 服务评分 星级 店铺ID 公共交通 纬度 经度 行政区名称”。

  • 地理位置

由于地理位置最直观,能够给客户(观众)留下印象,首先是地理位置展示,从这个角度,我们最容易想到是店铺数量在不同区域存在不同的分布,在这里我们给出了一个行政区的划分,所以很容易做出了第一个图,主要用不同颜色表示不同行政区的美食数量,为了横向比较一下数量,做了一个柱状图。

第二个图则是将地理位置和价格联系到一起,采用了热力图的形式,热度表示价格,呈现了整个广州市区的价格热度分布。

商圈

在地理位置之后,就是从商圈分析,商圈作为城市宣传或者美食指南中还是比较重要的,因为它涵盖了一系列美食,往往还有配套的娱乐设施,具有一体化的特征,商圈的消费水平也是为消费者提供的一个重要参考。

第一步针对餐厅个体做出一个直方图的分布,虽然上面一张PPT看上去满眼全是红色,但大部分的餐厅的人均消费水平都集中在50-100元的区间内,但同时也存在少部分大于500的极端值。

餐厅的级别以四星级和五星级为主,占比近9成,同时从直方图的颜色可以看出除了两个极端值外,各价位的星级分布没有明显差异。

这一张ppt我们统计了商圈的的人均价格中位数(剔除了商圈内包含样本数小于5的商圈),发现处于头部的四个商圈的人均价格中位数比剩余的高出一个断层,我们可以认为这四家商圈定位是高端的消费群体,进一步我们绘制了它们的分布地理图,从图中可以主要看出天河,越秀,海珠,荔湾等区域的中心或交界处,从地理位置看处于整个广州市的核心地带。从标记点颜色看,最低的价格有人均60左右的,最高的高达人均500的水平,整体价格从颜色看符合高端消费。

这一张PPT我们看处于平价消费的四家商圈,分别为江南西,中山七八路,芳村,江南大道,右侧是地理分布图,这些商圈主要集中在荔湾的中下部和与越秀区接壤的部分,海珠区的中部等。从映射图我们可以看出,基本没有红色的系比较深的点,整体人均价格在250以下,不存在任何极端值,这也能说明这些商圈的定位也是偏平价。

上面两种相对立的,定位于不同消费群体商圈除了在地理位置上有所区别之外,还有没有什么不同之处呢,我们对推荐菜品做了一个简单的词云分析,左侧是人均消费大于200的高端消费商家的推荐餐品,右侧是人均消费小于70的评价类商家的推荐菜品,我们还是可以明显看出了有一些差别,左侧主推的食物都是比较贵的,三文鱼,刺身,鹅肝,食材比较稀有,对品质要求较高。右侧的食物都是一些比较大众的五花肉,炸腐竹等,偏常规,食材易加工,附加价值较低。由此我们看出两者除了在位置上有差异,食品类别也有差异,定位区分度大,不易产生直接竞争。

评分角度

从商圈角度讨论完之后,我们从大家最关心的评分角度看一下广州市的美食大众点评得分上呈现什么规律。从图形中看出口味、服务评分大致属于中心分布,环境评分左偏。左偏分布说明广州市的商铺的整体环境较好,相对的得分较高。

同时我们观察到环境评分和服务评分相关性较高,相关系数得到0.68,说明广州作为一线城市,商圈整体的质量较高,对餐饮的软性附加服务(服务质量和环境的)要求均达到很高的水准

此外,口味得分仍然是呈现一种中心分布,这也和食物口味这种东西相对来说更难量化,口味不一一等原因。

从菜系入手的菜品推荐

这两页ppt我们主要利用盒子图发现广州市提供的不同菜系的一些规律并给出推荐菜品。我们剔除了一些涵盖样本较少的菜系。

首先是价格分析自助餐和面包甜点的价格极差最大,整体来说自助,日料,西餐价格比较高,对于极差大的可以根据自己的消费能力选择到合适的店铺。

再是综合得分分析,我们将口味服务环境简单平均获得综合得分,韩国料理,日料,火锅,粤菜的综合评分极差很大,消费者挑选时注意踩雷的风险。

最后从综合得分中选取了前10名的餐厅,菜系主要集中在日料、面包甜点,也有少量西餐火锅粤菜;从地图看出主要分布在天河、海珠、白云区;人均价格从75-550元都有。感兴趣的朋友可以去尝试一下。

(三)技术支持tableau+pyecharts

所有的地图主要完成都是通过pyecharts,本来可以用tableau的地图真的很方便,但是由于它不好显示行政区的边界,最后还是放弃了,选择码代码,用了geo和普通的地图两个模块。但是如果tableau的地图如果能把行政区的边界做出来的话,可以省了很多麻烦。具体的代码和数据我整理一下,如果想复现可以给我留言,欢迎大家交流学习。

pyecharts geo_pyechartstableau可视化分析案例+分析思路相关推荐

  1. rostcm6情感分析案例分析_卷积情感分析

    这是一个面向小白(比如,本人)的关于情感分析的系列教程 [1].老鸽子整理了"4 - Convolutional Sentiment Analysis.ipynb"中的内容. 本文 ...

  2. rostcm6情感分析案例分析_电商评论情感分析

    并可以实现云图的可视化.7.2 R的实现这里需要安装几个必须包,因为有几个包安装比较复杂,这里给了链接http://blog.csdn.net/cl1143015 ... 82731大家可以参看这个博 ...

  3. 电影分析案例-分析导演、演员拍电影盈利和票房(2021/07/25)

    次案例主要是对数据计算的应用. 如题,数据还是movie数据,分别通过以下指标分析导演和演员的盈利能力 1.计算导演的总票房gross,排名 2.计算导演的总利润gross-budget,排名 3.筛 ...

  4. python-数据分析--案例分析:美国各州人口数据分析

    目标:找到美国人口密度最大的5个州 import numpy as np import pandas as pd from pandas import Series, DataFrame #首先导入文 ...

  5. DMS应用性能管理案例分析(一)

    前言 某汽车总部部署的DMS经销商在线系统,最近一段时间运维人员经常接到反馈,DMS使用出现大量访问慢的情况,针对此情况进行监测分析. 汽车总部已部署NetInside流量分析系统,使用流量分析系统提 ...

  6. SS00023.algorithm——|ArithmeticMachine.v23|——|Machine:项目实战.v03|案例分析|

    一.案例分析 ### --- 案例分析~~~ 我们可以大概判别哪些特征很可能和用户是否购买保险会有相关关系. ~~~ 也可以结合我们的业务经验,以及数据可视化,特征工程方法,先行探索一下, ~~~ 这 ...

  7. 2013下半年(11月)信息系统项目管理师考试题型分析(综合知识、案例分析、论文)...

    2013下半年(11月)信息系统项目管理师考试真题题型分析PDF下载:http://www.cnitpm.com/down/ShowForum-409202-1.htm 2013下半年(11月)信息系 ...

  8. python数据分析及可视化(十四)数据分析可视化练习-上市公司可视化数据分析、黑色星期五案例分析

    上市公司数据分析 从中商情报网下载的数据,表格中会存在很多的问题,查看数据的信息有无缺失,然后做数据的清晰,有无重复值,异常数据,省份和城市的列名称和数据是不对照的,删除掉一些不需要的数据,省份不完整 ...

  9. 2011下半年案例分析题的解答思路_信息系统项目管理师考试

    2011下半年案例分析题的解答思路_信息系统项目管理师考试 试题1 请参见<信息系统项目管理师考试案例梳理.真题透解与强化训练>P124  模拟试题7 试题2 请参见<信息系统项目管 ...

最新文章

  1. FxCop的一些规范建议
  2. DNS实现域名负载均衡
  3. 运维必知的23个经验教训,值得收藏!
  4. Java EE 7批处理和魔兽世界–第2部分
  5. firefox应用自动全屏显示_【b】—自动化测试:基础selenium—API
  6. PMP考试技巧(必备)
  7. docker-compose命令介绍和使用【官方英文文档翻译】【附加案例】
  8. 大数据之Spark教程
  9. Team Foundation Server 2010 安装、部署与配置(六):创建 Team Project .
  10. Windows编辑shell脚本后上传Linux格式问题
  11. dmv 统计数据库io_使用内置功能和动态管理视图(DMV)发现特定于数据库的信息
  12. html单页倒计时,单页面vue实例带倒计时功能
  13. java定义数字类型的代码_数字类型内置方法(示例代码)
  14. java xml 转excel_如何用java实现xml文件转excel
  15. 安卓反编译smali代码注入第三方广告
  16. 不要迷恋哥,哥不只是传说(再【转】世界上最牛的程序员)
  17. HDU 4435 charge-station (搜索+YY)
  18. 苹果cms影片集数不更新解决方法
  19. 什么是深度学习,深度学习和机器学习之间,主要有什么区别
  20. type-c英文怎么读音发音,type-c怎么读英语发音

热门文章

  1. 研究SAP service order status存储字段
  2. SAP CRM WebClient UI context node属性展开的执行逻辑
  3. matlab 取43阶上部分,求教关于matlab四阶累积量函数里变量的意义。
  4. java perm 查看_高级 Java 必须掌握:JVM 分析工具和查看命令,超详细
  5. ElasticSearch常用命令记录
  6. 离散信号的希尔伯特变换的计算公式_希尔伯特变换和瞬时频率问题--连载(二)...
  7. 在python中value是啥意思_【Python】python,字典中如何根据value值取对应的key值
  8. python中forward函数的引用_pytorch 调用forward 的具体流程
  9. ios解锁动态图片_iOS 苹果开机启动的 滑动来解锁动画
  10. oracle指定源位置怎么弄,ORACLE Goldengate测试解决源端和目标端表结构字段位置不同的2种实现方法...