盼望着盼望着,五一小长假终于到来

在这四天假期里,相信有很多同学十分纠结,也许你想着出去浪,结果一出门......

可是这么多天假期,怎能甘心呆在宿舍做个快乐肥宅?

我们爬取了去哪儿网,获得了上海1500+景点数据(不得不说原来上海有这么多可以玩的地方),用数据来向你分析上海景点。

01数据获取和展示

  • 部分代码

  • 部分数据一览

02上海景点分布

通过爬取到的数据可得,上海一共有1587个旅游景点,其中5A景区有3个,4A景区有36个,3A景区有9个。那么这些景区主要分布在上海的哪些地方呢?在这里我使用了高德开放接口MapLab,将所获取到所有景点坐标输入到上海地图中

可以看出,景点分布呈中部集中,四周发散的状态;上海中心市区部分如黄浦区、徐汇区还有浦东新区景点十分密集,可以说这与经济发展有一定的关系。

03哪些景点热度更高

接着,我们分析获取到的数据中,哪些景点的热度更高,搜索量更大,更受游客期待。

可以看出外滩以100%的热度高居榜首,而且前10榜单里一半都在外滩附近。不过打开谷歌搜索外滩,第一个出来的就是

这也难怪,作为上海这座东方大都会的著名景观,许多地标性建筑就在附近,可以说外滩已成上海的一个象征,游客打卡圣地。在这里你可以眺望黄浦江,看看周围古老的建筑,感受上海的繁华。

(摄于2016年9月17日)

04哪些景点最值得去

前面我们通过搜索量得到外滩的热度最高,更受游客期待。但除了外滩,上海还有哪些地方更受游客青睐呢?这里我们通过景区门票销售量来分析。

可以看出,上海迪士尼和欢乐谷遥遥领先,这两个都是上海比较著名的放松游玩地。另外还有野生动物园、海洋公园、蜡像馆、上海动物园等涨知识胜地,以及中心大厦、东方明珠、黄浦江游玩等探索上海的繁华胜地。

观察销量TOP区域分布,这些地方无一例外都在市中心周围,这与前面的景区分布图相呼应,可以猜测这些旅游景点应该拉动了不少经济。

这里我好奇地看了下景区价格TOP10

前面的两个地点价格吓了我一跳,搜索才发现这其实是去哪儿网的套路,这两个地方都是免费参观的,它的价格是包含了包车以及周围景点一日游的套票。在这里迪士尼的价格才是货真价实的TOP1,再结合上图迪士尼的销量也是TOP1,只能说迪士尼爸爸真厉害。

05总结

  1. 上海景点较为集中地分布在中部市区,这可能与经济发展有一定关系

  2. 外滩作为上海标志性地点,毫无疑问地成为了搜索量最高及最受游客期待景点,其周围也有许多著名景点

  3. 从门票销量来分析,迪士尼、欢乐谷、野生动物园等著名游玩景点十分火爆,其中迪士尼双TOP可预见这个假期人从众。

玩什么玩?

劳动节还不老老实实搬砖!

欢迎关注我的公众号,获取更多。

去哪儿网上海景点数据爬虫分析相关推荐

  1. 手把手教你利用 python 爬虫分析基金、股票

    手把手教你利用 python 爬虫分析基金.股票 文章目录 手把手教你利用 python 爬虫分析基金.股票 第一步:基金数据爬取 第二步:股票增持计算 第三步:好股基金选取 桌面程序 exe 从前大 ...

  2. python爬虫分析_Python爬虫解析网页的4种方式

    文章目录 爬虫的价值 正则表达式 requests-html BeautifulSoup lxml的XPath 爬虫的价值 常见的数据获取方式就三种:自有数据.购买数据.爬取数据.用Python写爬虫 ...

  3. 人人美剧迅雷链接多线程和多进程爬虫分析

    人人美剧迅雷链接多线程和多进程爬虫分析 浅谈GIL cpu计算密集型 IO密集型 普通裸奔 多线程 多进程+多线程 总结 浅谈GIL 使用python中的多线程就不得不聊聊GIL,基于cpython, ...

  4. Python 爬虫分析豆瓣 TOP250 之 信息字典 和 马斯洛的锥子

    问题 本文是对<Python 爬虫分析豆瓣 TOP250 告诉你程序员业余该看什么书?> 一文的补充 我们以<追风少年>为例 用chrome的developer tool查看源 ...

  5. python爬虫今日头条_python爬虫—分析Ajax请求对json文件爬取今日头条街拍美图

    python爬虫-分析Ajax请求对json文件爬取今日头条街拍美图 前言 本次抓取目标是今日头条的街拍美图,爬取完成之后,将每组图片下载到本地并保存到不同文件夹下.下面通过抓取今日头条街拍美图讲解一 ...

  6. ❤️大佬都在学什么?Python爬虫分析C站大佬收藏夹,跟着大佬一起学, 你就是下一个大佬❤️!

    ❤️大佬都在学什么?Python爬虫分析C站大佬收藏夹,跟着大佬一起学,你就是下一个大佬❤️! 前言 程序说明 数据爬取 获取 CSDN 作者总榜数据 获取收藏夹列表 获取收藏数据 爬虫程序完整代码 ...

  7. 安居客爬虫+分析+回归

    安居客爬虫+分析+回归 工具:Pycharm,Win10,Python3.6.4 这次我们要做的是安居客西安地区房源爬虫,然后数据分析,并做一个简单的回归分析. 我们之前的爬虫和简单的数据分析已经说了 ...

  8. Python基础教程让小白从入门到精通(一)爬虫分析

    几个问题: 微信QQ验证码滑动拼图真的能防盗防信息泄露吗? 外卖购物订宾馆真的是几百个人的好评才出现在你的推荐里么? 微博直播平台上的热搜热点话题大V互动是真实发生的吗? 浏览器关键字信息真的是想让你 ...

  9. 婚庆市场用户行为数据采集爬虫分析报告(以小红书为例)

    原文链接  http://tecdat.cn/?p=2072 小红书作为网友的"种草基地",里面有来自全国各地婚礼策划企业,新人们会选择在平台上进行了解,收集自己想要的服务.本文对 ...

最新文章

  1. c#泛型的使用[转]
  2. 【正一专栏】春日随感—赢在起跑线上
  3. Gym 101334F Feel Good
  4. Ubuntu上安装使用Docker
  5. java中说明书/开发文档如何编写?
  6. 项目管理:RASCI模型
  7. php导出word乱码,php导出的word会乱码吗
  8. 基于ANSYS某商场旋转楼梯钢结构受力分析
  9. 模电学习感想,也叫笔记
  10. php定时发送qq消息,无需任何工具发送定时QQ消息
  11. 今天零晨的大雨好厉害呀
  12. 与公共云提供商进行谈判的3个技巧
  13. 用html和js制作一个控制灯泡开关效果
  14. 浙江省2021年高新技术企业认定补贴奖励查询及优惠政策,国高达60万
  15. nginx02-RTFM
  16. 码元速率的盲估计-包络谱法
  17. 「镁客早报」华为余承东欢迎苹果使用5G芯片;三星首款折叠手机本月开卖...
  18. 微信平台申请消息接口时Signature校验的Servlet实现
  19. NSA提供有关如何降低位置跟踪风险的建议
  20. 苹果开发者账号申请流程完整版 https://www.jianshu.com/p/655380201685

热门文章

  1. 代理服务器可能有问题,或地址不正确的解决方法
  2. matlab 没有sym函数,错误使用== fprintf函数没有为'sym'输入定义
  3. 已解决-‘cv2’ has no attribute ‘gapi_wip_gst_GStreamerPipeline’
  4. Vue图片加载错误、图片加载失败的处理
  5. mono android单选按钮,CLEngine
  6. 用友盟社会化组件,分享到微信和新浪微博
  7. JAVAWeb ——静态网页
  8. knif4j 在线APl 文档测试
  9. BYOD -- 企业的困境与力量
  10. vue+百度地图实现搜索功能