2020 国庆马上就要到了 我想今年大家在家都憋坏了 今年国庆和中秋刚好又是同一天,加起来有 8 天假 这么长的假期,当然是出去 玩玩玩!

但是每次长假期间,你有没有想起被人山人海支配的恐惧呢?

那么该去哪些地方呢? 下面我用 Python 爬取了全国近 5000 个旅游景点,并结合 pyecharts 来做分析 技能包

  • 爬虫

  • Mysql

  • sqlalchemy

  • pyecharts

数据爬取 旅游景点的数据是从网上爬取的,该数据包含以下维度:景点名称,所属省市区,景点简介,门票价格,评分,近期销量,景点评级等。 爬虫比较简单,多分析下就可以,直接贴代码了

爬虫代码

基本上没什么反爬,加点延时别爬太快就是了...

爬取下来之后直接入库,入库部分代码如下:

入库

当然,每个省份我只爬了前 10 页,因为后面的基本都是些不知名的旅游景点

爬完之后看了下数据库有 4572 条数据,我想应该够了吧...

有了数据之后,是不是就能搞事情了...,简单做几个分析

数据分析

接下来我们使用 pyecharts 来对爬取的数据做一个简单的分析

1. 景点销量排行榜

直接从数据库查出数据,丢进去就行。

结果展示:

2. 景点评级排行榜

假期这么长,想玩的地方有很多!如何选择一个景点多的地方并且评级高的

这样就能在一个地方尽情的玩耍,而不用四处奔波

我们不妨来看看各省市能排的上号的景点有多少吧!

代码如下:

将数据查询出来后作一个简单的清洗,统计各省份 4A 级以上景点数量

一起来看看吧

再将这些数据放到地图上看看..更加直观

3.各省销量排行榜

通过该数据,可以看出哪些省市区的人会比较多...

这样就能避免去人山人海的地方看人人人人.。。

综合分析

最终考虑去哪儿,可能需要多维度的分析。

所有,我把价格,评分,销量这三个维度放在一起

当然,你也可以选择你关心的维度来..最好自己动手试试

这样印象深刻!

来看看效果把:

重点关注下销量高,评分高,价格合适的...

提前祝大家国庆有个美好的假期! 此文转载文,著作权归作者所有,如有侵权联系小编删除!

完整代码点这里下载

国庆小长假来点不一样的,如何用Python爬取了全国近5000家旅游景点,一起来看相关推荐

  1. 用Python爬取了全国近5000家旅游景点,分析国庆去哪玩

    双节同庆,小长假如约而至 我想今年大家在家都憋坏了 这么长的假期,当然是出去 玩玩玩! 每当长假的时候,有没有想起被人山人海支配的恐惧! 该去哪些地方呢? 我用 Python 爬取了全国近 5000 ...

  2. python爬取旅游信息_用Python爬取了全国近5000家旅游景点,分析国庆去哪玩

    2020 国庆马上就要到了 我想今年大家在家都憋坏了 今年国庆和中秋刚好又是同一天,加起来有 8 天假 这么长的假期,当然是出去 玩玩玩! 但是每次长假期间,你有没有想起被人山人海支配的恐惧呢? 那么 ...

  3. 国庆去哪玩?用Python爬取了全国5000家旅游景区(记得收藏)

    2020 国庆马上就要到了 我想今年大家在家都憋坏了 今年国庆和中秋刚好又是同一天,加起来有 8 天假 这么长的假期,当然是出去 玩玩玩! 但是每次长假期间,你有没有想起被人山人海支配的恐惧呢? 那么 ...

  4. python爬取小游戏_如何用Python爬取小游戏网站,把喜欢的游戏收藏起来(附源码)...

    简介: Python 是一门简单易学且功能强大的编程语言,无需繁琐的配置,掌握基本语法,了解基本库函数,就可以通过调用海量的现有工具包编写自己的程序,轻松实现批量自动化操作,可以极大提高办公和学习效率 ...

  5. 如何用Python爬取小游戏网站,把喜欢的游戏收藏起来(附源码)

    简介: Python 是一门简单易学且功能强大的编程语言,无需繁琐的配置,掌握基本语法,了解基本库函数,就可以通过调用海量的现有工具包编写自己的程序,轻松实现批量自动化操作,可以极大提高办公和学习效率 ...

  6. 我悄咪咪告诉你:罩杯越小的妹子倾向买越贵的内衣~~Python爬取京东9000条内衣销售数据之数据关联度分析

    将爬取的9000条内衣销售数据整理清洗后,基于Apriori关联算法,针对"罩杯和消费价格倾向这两个元素有无关系"这个问题进行分析 上一篇用数据库清洗数据,点这里 再上一篇爬取数据 ...

  7. python 24位图转 8位_Python爬取PPT模板小工具下载-Python爬取PPT模板小工具免费版下载v1.0...

    由于很多PPT抓取工具都会因为版本问题无法使用,所以论坛大神就自己写了这款Python爬取PPT模板小工具,可以帮助用户轻松获取各种PPT模板,使用的时候注意一次只能下载一种类型.软件仅供交流学习,下 ...

  8. Python爬取小姐姐美照

    大家好  我是阿喵 今天教大家用如何用爬虫爬取可爱小姐姐的美照 第一步:现将python环境搭建好,工欲利其事必先利其器! 第二步:寻找目标网站,我选择的网站是http://www.win4000.c ...

  9. python爬取微信小程序(实战篇)_爬虫爬取微信小程序

    之前打算做个微信小程序的社区,所以写了爬虫去爬取微信小程序,后面发现做微信小程序没有前途,就把原来的项目废弃了做了现在的网站观点,不过代码放着也是放着,还不如公开让大家用,所以我把代码贴出来,有需要的 ...

最新文章

  1. boundingRectWithSize 的使用
  2. 专访闪送联合创始人于红建:要继续深耕国内市场
  3. 小功能隐藏着大学问---windows的ACL带来的挑战
  4. MySQL 中的三中循环 while loop repeat 的基本用法
  5. sql2000数据类型对应的数值_Qlikview---数据类型
  6. 人工蜂群算法的最小搜索模型_【优化求解】人工蜂群ABC算法
  7. CodeForces - 416A Guess a number
  8. 总结的AngularJS1版本的一些面试问题
  9. AIDA64 Extreme Edition(硬件检测)多国语言绿色特别版
  10. linux win10五笔码表,Win10五笔助手下载_WubiLex微软五笔助手下载免费版9.9.6.0 - 系统之家...
  11. 【Ghost Explore】镜像文件查看器
  12. C/S架构系统的自动更新功能设计与实现(四)
  13. 关于小米笔记本pro频繁蓝屏问题
  14. mqtt java教程_MQTT X 使用指南
  15. Gin渲染html模板报错:ends in a non-text context: {stateHTMLCmt delimNone urlPartNone jsCtxRegexp attrNone
  16. 日本房地产泡沫 Japan Real Estate Bubble
  17. r语言使用linux命令,技术|如何在 Ubuntu 上安装和使用 R 语言
  18. 什么是系统建模语言(SysML)?
  19. 软件开发及计算机基础
  20. html内联样式(表),外部样式表

热门文章

  1. html中align属性的justify,css text-align属性简介说明
  2. 在线markdown编辑器生成甘特图,太爱了
  3. 文本生成 计算机语言,自然语言处理 -- 文本生成概述
  4. 思比科系列CMOS图像传感器应用方案分析
  5. 金融机构系统性风险分析(Domestic+MES模型)200701-202012
  6. 云运维拓扑图_云计算中心拓扑图
  7. css 中多个class选择器的详解
  8. python运维招聘_利用 Python 爬取了 13966 条运维招聘信息,看看你是否符合招聘信息!...
  9. 美国国家标准与技术实验室对云计算的定义
  10. 揭秘微软树屋,员工可在里面开会、工作、晒日光浴