去哪儿网上海景点数据爬虫分析
盼望着盼望着,五一小长假终于到来
在这四天假期里,相信有很多同学十分纠结,也许你想着出去浪,结果一出门......
可是这么多天假期,怎能甘心呆在宿舍做个快乐肥宅?
我们爬取了去哪儿网,获得了上海1500+景点数据(不得不说原来上海有这么多可以玩的地方),用数据来向你分析上海景点。
01数据获取和展示
部分代码
部分数据一览
02上海景点分布
通过爬取到的数据可得,上海一共有1587个旅游景点,其中5A景区有3个,4A景区有36个,3A景区有9个。那么这些景区主要分布在上海的哪些地方呢?在这里我使用了高德开放接口MapLab,将所获取到所有景点坐标输入到上海地图中
可以看出,景点分布呈中部集中,四周发散的状态;上海中心市区部分如黄浦区、徐汇区还有浦东新区景点十分密集,可以说这与经济发展有一定的关系。
03哪些景点热度更高
接着,我们分析获取到的数据中,哪些景点的热度更高,搜索量更大,更受游客期待。
可以看出外滩以100%的热度高居榜首,而且前10榜单里一半都在外滩附近。不过打开谷歌搜索外滩,第一个出来的就是
这也难怪,作为上海这座东方大都会的著名景观,许多地标性建筑就在附近,可以说外滩已成上海的一个象征,游客打卡圣地。在这里你可以眺望黄浦江,看看周围古老的建筑,感受上海的繁华。
(摄于2016年9月17日)
04哪些景点最值得去
前面我们通过搜索量得到外滩的热度最高,更受游客期待。但除了外滩,上海还有哪些地方更受游客青睐呢?这里我们通过景区门票销售量来分析。
可以看出,上海迪士尼和欢乐谷遥遥领先,这两个都是上海比较著名的放松游玩地。另外还有野生动物园、海洋公园、蜡像馆、上海动物园等涨知识胜地,以及中心大厦、东方明珠、黄浦江游玩等探索上海的繁华胜地。
观察销量TOP区域分布,这些地方无一例外都在市中心周围,这与前面的景区分布图相呼应,可以猜测这些旅游景点应该拉动了不少经济。
这里我好奇地看了下景区价格TOP10
前面的两个地点价格吓了我一跳,搜索才发现这其实是去哪儿网的套路,这两个地方都是免费参观的,它的价格是包含了包车以及周围景点一日游的套票。在这里迪士尼的价格才是货真价实的TOP1,再结合上图迪士尼的销量也是TOP1,只能说迪士尼爸爸真厉害。
05总结
上海景点较为集中地分布在中部市区,这可能与经济发展有一定关系
外滩作为上海标志性地点,毫无疑问地成为了搜索量最高及最受游客期待景点,其周围也有许多著名景点
从门票销量来分析,迪士尼、欢乐谷、野生动物园等著名游玩景点十分火爆,其中迪士尼双TOP可预见这个假期人从众。
玩什么玩?
劳动节还不老老实实搬砖!
欢迎关注我的公众号,获取更多。
去哪儿网上海景点数据爬虫分析相关推荐
- 手把手教你利用 python 爬虫分析基金、股票
手把手教你利用 python 爬虫分析基金.股票 文章目录 手把手教你利用 python 爬虫分析基金.股票 第一步:基金数据爬取 第二步:股票增持计算 第三步:好股基金选取 桌面程序 exe 从前大 ...
- python爬虫分析_Python爬虫解析网页的4种方式
文章目录 爬虫的价值 正则表达式 requests-html BeautifulSoup lxml的XPath 爬虫的价值 常见的数据获取方式就三种:自有数据.购买数据.爬取数据.用Python写爬虫 ...
- 人人美剧迅雷链接多线程和多进程爬虫分析
人人美剧迅雷链接多线程和多进程爬虫分析 浅谈GIL cpu计算密集型 IO密集型 普通裸奔 多线程 多进程+多线程 总结 浅谈GIL 使用python中的多线程就不得不聊聊GIL,基于cpython, ...
- Python 爬虫分析豆瓣 TOP250 之 信息字典 和 马斯洛的锥子
问题 本文是对<Python 爬虫分析豆瓣 TOP250 告诉你程序员业余该看什么书?> 一文的补充 我们以<追风少年>为例 用chrome的developer tool查看源 ...
- python爬虫今日头条_python爬虫—分析Ajax请求对json文件爬取今日头条街拍美图
python爬虫-分析Ajax请求对json文件爬取今日头条街拍美图 前言 本次抓取目标是今日头条的街拍美图,爬取完成之后,将每组图片下载到本地并保存到不同文件夹下.下面通过抓取今日头条街拍美图讲解一 ...
- ❤️大佬都在学什么?Python爬虫分析C站大佬收藏夹,跟着大佬一起学, 你就是下一个大佬❤️!
❤️大佬都在学什么?Python爬虫分析C站大佬收藏夹,跟着大佬一起学,你就是下一个大佬❤️! 前言 程序说明 数据爬取 获取 CSDN 作者总榜数据 获取收藏夹列表 获取收藏数据 爬虫程序完整代码 ...
- 安居客爬虫+分析+回归
安居客爬虫+分析+回归 工具:Pycharm,Win10,Python3.6.4 这次我们要做的是安居客西安地区房源爬虫,然后数据分析,并做一个简单的回归分析. 我们之前的爬虫和简单的数据分析已经说了 ...
- Python基础教程让小白从入门到精通(一)爬虫分析
几个问题: 微信QQ验证码滑动拼图真的能防盗防信息泄露吗? 外卖购物订宾馆真的是几百个人的好评才出现在你的推荐里么? 微博直播平台上的热搜热点话题大V互动是真实发生的吗? 浏览器关键字信息真的是想让你 ...
- 婚庆市场用户行为数据采集爬虫分析报告(以小红书为例)
原文链接 http://tecdat.cn/?p=2072 小红书作为网友的"种草基地",里面有来自全国各地婚礼策划企业,新人们会选择在平台上进行了解,收集自己想要的服务.本文对 ...
最新文章
- c#泛型的使用[转]
- 【正一专栏】春日随感—赢在起跑线上
- Gym 101334F Feel Good
- Ubuntu上安装使用Docker
- java中说明书/开发文档如何编写?
- 项目管理:RASCI模型
- php导出word乱码,php导出的word会乱码吗
- 基于ANSYS某商场旋转楼梯钢结构受力分析
- 模电学习感想,也叫笔记
- php定时发送qq消息,无需任何工具发送定时QQ消息
- 今天零晨的大雨好厉害呀
- 与公共云提供商进行谈判的3个技巧
- 用html和js制作一个控制灯泡开关效果
- 浙江省2021年高新技术企业认定补贴奖励查询及优惠政策,国高达60万
- nginx02-RTFM
- 码元速率的盲估计-包络谱法
- 「镁客早报」华为余承东欢迎苹果使用5G芯片;三星首款折叠手机本月开卖...
- 微信平台申请消息接口时Signature校验的Servlet实现
- NSA提供有关如何降低位置跟踪风险的建议
- 苹果开发者账号申请流程完整版 https://www.jianshu.com/p/655380201685
热门文章
- 代理服务器可能有问题,或地址不正确的解决方法
- matlab 没有sym函数,错误使用== fprintf函数没有为'sym'输入定义
- 已解决-‘cv2’ has no attribute ‘gapi_wip_gst_GStreamerPipeline’
- Vue图片加载错误、图片加载失败的处理
- mono android单选按钮,CLEngine
- 用友盟社会化组件,分享到微信和新浪微博
- JAVAWeb ——静态网页
- knif4j 在线APl 文档测试
- BYOD -- 企业的困境与力量
- vue+百度地图实现搜索功能