Python数据分析入门(四)
前言
上期给大家分享了关于豆瓣5500部电视剧的分析,那么这次我们就给吃货们带来一些福利,此次我们的主题为“寻找最好吃的火锅”。进入主题之前,先给所有的吃货们带来一桌美味的火锅,作为各位看官的前菜。
数据采集
此次我们采集的是移动端大众点评上所有带有火锅标签的餐厅,如下图所示。
选择一个火锅店点击页面详细信息
此次需要采集的信息是餐厅名称,人均价格、点评人数以及餐厅的评分(口味。环境,服务),用于后文的分析。
数据分析
此次一共采集了100个城市,22554家火锅店,1597万条评论来做为我们分析的基础。先来看看火锅的全国热力图。
是不是跟大家想得有点不一样,的确,小编也没有想到。火锅店数量较多的还是在华东和华北区域。我们再来看看TOP20城市的火锅店数量。
可以看出前10的城市火锅数量相隔不大,后10位的城市火锅数量也相差不大,这说明从全国来看火锅的受众群体和需要量还是比较大的,吃火锅也是一件很“流行”的事。
再来看看TOP20城市的评论数量。
可以看出上海的评论数量遥遥领先于其它城市,可能存在以下两个因素:a.上海市的火锅餐厅数量较多,本身存在较大的消费群体 b.大众点评总部在上海,上海的商户入驻数量较多。如有兴趣的朋友可以进行更深一步的研究。
讨论完了火锅数量和评论数后,我们再来看看TOP20城市的火锅人均消费是多少。
可以看出上海不仅火锅店的数量比较多,它的价格也是全国城市当中最高的,人均价格达到了147元,而成都的人均价为88元,最后一名武汉的火锅店人均价格为83元,火锅之都重庆的价格却不在上述列表内,说明它的人均价格是低于83元的。我们再来看看TOP20城市的火锅店平均分,平均分的计算方式是火锅店的评分(口味。环境,服务)三者之后除以3之后所得。
不出所料,火锅之都重庆是此次评分的榜首,武汉屈居第二,南京则排到了第三。那么分析到这里我们就已经有自己的结论了,武汉和重庆这两座城市是目前城市里吃火锅性价比最高的,它们城市的火锅店不仅评分高,价格还比较实惠。而且这两座城市还有许多著名的景点,所以我们在旅途中不光可以看到美丽的风景,也还可以吃到好吃的火锅,岂不是一件很美妙的事。尤其是小编所在的武汉,除了火锅,还有大量其它的美食。如果你是吃货,并且热爱旅游,那么这两个城市应该是你的首选之地。最后我们再放上好吃的火锅。
好了,不说了,小编吃火锅去了。
需要源码的读者可以后台留言,小编看到就会第一时间回复你。
对爬虫,数据分析,算法感兴趣的朋友们,可以加微信公众号 TWcoding,我们一起玩转Python。
If it works for you.Please,star.
自助者,天助之
转载于:https://juejin.im/post/5b80b99b6fb9a01a15728fe7
Python数据分析入门(四)相关推荐
- Python数据分析入门之pandas基础总结
Pandas--"大熊猫"基础 Series Series: pandas的长枪(数据表中的一列或一行,观测向量,一维数组...) Series1 = pd.Series(np.r ...
- python数据分析入门学习笔记
python数据分析入门学习笔记儿 学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我 ...
- Python数据分析入门笔记4——数据预处理之重复值
系列文章目录 Python数据分析入门笔记1--学习前的准备 Python数据分析入门笔记2--pandas数据读取 Python数据分析入门笔记3--数据预处理之缺失值 Python数据分析入门笔记 ...
- Python数据分析入门笔记6——数据清理案例练习
系列文章目录 Python数据分析入门笔记1--学习前的准备 Python数据分析入门笔记2--pandas数据读取 Python数据分析入门笔记3--数据预处理之缺失值 Python数据分析入门笔记 ...
- python数据分析要学什么_python数据分析学什么?python数据分析入门
有很多没有基础的新手想学习python数据分析,却在纠结python数据分析难不难学?下面万古网校小编给大家整理了资料,为各位分享! 1.python难不难? Python可以说是目前比较主流而且易学 ...
- python 数据分析学什么-python数据分析学什么?python数据分析入门
有很多没有基础的新手想学习python数据分析,却在纠结python数据分析难不难学?下面万古网校小编给大家整理了资料,为各位分享! 1.python难不难? Python可以说是目前比较主流而且易学 ...
- 分享一份60页的《Python数据分析入门PPT》
小伙伴你好,资料会有的,我先做个自我介绍. 我是小詹.一名即将毕业的研究生,一个懂点技术和运营的产品人. 爱折腾爱分享,我在大学时通过副业实现了经济独立,偶尔还能补贴家用,在北漂求学的 7 年里还算精 ...
- python数据分析入门
python数据分析入门,作为入门文章系列主要包含以下几个内容: 1.数据的来源(本案例采用的数据来自于上一篇文章中爬取的智联招聘信息):读取数据库数据.数据写入csv文件.读取csv文件等 2.数据 ...
- Python爬虫入门四之Urllib库的高级用法
1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性. 首先,打开我们的浏览 ...
最新文章
- 计算机网络数据分析报告,贵州大学计算机网络实验报告-实验四-分析IP协议数据包格式...
- python好还是c好-对比平台--Python与C ++之间的差异
- 如何使用 Node 后端创建 React 应用程序:完整指南
- thinking-in-java(10)内部类
- 三维空间中曲线绕任意轴旋转所得的旋转曲面求法
- android 里程,鹰眼Android SDK | 百度地图API SDK
- python运行报错_请教大神python运行书上源码报错,请指点,谢谢
- centos7 编译php5.3,centos7下编译安装php7.3
- .NET应用架构设计—表模块模式与事务脚本模式的代码编写
- C# TabControl增加关闭按钮
- 颠覆你的思维,探寻人类发展史
- CSS 的相对单位 em 与 ex
- 十八.国民技术MCU开发之UART模块LIN模式主从通信交互案例
- java开发用win7好还是win10_win7和win10系统哪个好用
- 继电器控制电路原理解析说明
- 神解释:为什么程序员怕改需求?
- 宇宙的本源—存在之道和变化之道
- 启动oracle时报错:PuTTY X11 proxy: unable to connect to forwarded X server: Network error:
- 破解flowplayer
- WPF GridSplitter中需要设置HorizontalAlignment和VerticalAlignment
热门文章
- 如何下载多段ts视频 m3u8 ffmpeg
- 在微型计算机系统中,打印机一般是通过( ,2013湖南省计算机等级考试试题 二级C试题最新考试试题库...
- html设置一个随机数的抽奖,随机数的运用---抽奖
- oracle连接工具_扯一扯Tableau软件配置数据源系列之Oracle
- 计算机和网络老是断开,电脑插上网线还是显示断开连接怎么办
- mysql的增_MySQL之增_insert-replace
- 什么叫大数据人物画像_大数据时代,如何构建精准用户画像,直击精细化运营...
- android+fastboot+命令,Android手机fastboot刷机命令
- lintcode最长回文子串(Manacher算法)
- html 中加号的表示方法,CSS的+(加号)选择器怎么用