国庆小长假来点不一样的,如何用Python爬取了全国近5000家旅游景点,一起来看
2020 国庆马上就要到了 我想今年大家在家都憋坏了 今年国庆和中秋刚好又是同一天,加起来有 8 天假 这么长的假期,当然是出去 玩玩玩!
但是每次长假期间,你有没有想起被人山人海支配的恐惧呢?
那么该去哪些地方呢? 下面我用 Python 爬取了全国近 5000 个旅游景点,并结合 pyecharts 来做分析 技能包
爬虫
Mysql
sqlalchemy
pyecharts
数据爬取 旅游景点的数据是从网上爬取的,该数据包含以下维度:景点名称,所属省市区,景点简介,门票价格,评分,近期销量,景点评级等。 爬虫比较简单,多分析下就可以,直接贴代码了
爬虫代码
基本上没什么反爬,加点延时别爬太快就是了...
爬取下来之后直接入库,入库部分代码如下:
入库
当然,每个省份我只爬了前 10 页,因为后面的基本都是些不知名的旅游景点
爬完之后看了下数据库有 4572 条数据,我想应该够了吧...
有了数据之后,是不是就能搞事情了...,简单做几个分析
数据分析
接下来我们使用 pyecharts 来对爬取的数据做一个简单的分析
1. 景点销量排行榜
直接从数据库查出数据,丢进去就行。
结果展示:
2. 景点评级排行榜
假期这么长,想玩的地方有很多!如何选择一个景点多的地方并且评级高的
这样就能在一个地方尽情的玩耍,而不用四处奔波
我们不妨来看看各省市能排的上号的景点有多少吧!
代码如下:
将数据查询出来后作一个简单的清洗,统计各省份 4A 级以上景点数量
一起来看看吧
再将这些数据放到地图上看看..更加直观
3.各省销量排行榜
通过该数据,可以看出哪些省市区的人会比较多...
这样就能避免去人山人海的地方看人人人人.。。
综合分析
最终考虑去哪儿,可能需要多维度的分析。
所有,我把价格,评分,销量这三个维度放在一起
当然,你也可以选择你关心的维度来..最好自己动手试试
这样印象深刻!
来看看效果把:
重点关注下销量高,评分高,价格合适的...
提前祝大家国庆有个美好的假期! 此文转载文,著作权归作者所有,如有侵权联系小编删除!
完整代码点这里下载
国庆小长假来点不一样的,如何用Python爬取了全国近5000家旅游景点,一起来看相关推荐
- 用Python爬取了全国近5000家旅游景点,分析国庆去哪玩
双节同庆,小长假如约而至 我想今年大家在家都憋坏了 这么长的假期,当然是出去 玩玩玩! 每当长假的时候,有没有想起被人山人海支配的恐惧! 该去哪些地方呢? 我用 Python 爬取了全国近 5000 ...
- python爬取旅游信息_用Python爬取了全国近5000家旅游景点,分析国庆去哪玩
2020 国庆马上就要到了 我想今年大家在家都憋坏了 今年国庆和中秋刚好又是同一天,加起来有 8 天假 这么长的假期,当然是出去 玩玩玩! 但是每次长假期间,你有没有想起被人山人海支配的恐惧呢? 那么 ...
- 国庆去哪玩?用Python爬取了全国5000家旅游景区(记得收藏)
2020 国庆马上就要到了 我想今年大家在家都憋坏了 今年国庆和中秋刚好又是同一天,加起来有 8 天假 这么长的假期,当然是出去 玩玩玩! 但是每次长假期间,你有没有想起被人山人海支配的恐惧呢? 那么 ...
- python爬取小游戏_如何用Python爬取小游戏网站,把喜欢的游戏收藏起来(附源码)...
简介: Python 是一门简单易学且功能强大的编程语言,无需繁琐的配置,掌握基本语法,了解基本库函数,就可以通过调用海量的现有工具包编写自己的程序,轻松实现批量自动化操作,可以极大提高办公和学习效率 ...
- 如何用Python爬取小游戏网站,把喜欢的游戏收藏起来(附源码)
简介: Python 是一门简单易学且功能强大的编程语言,无需繁琐的配置,掌握基本语法,了解基本库函数,就可以通过调用海量的现有工具包编写自己的程序,轻松实现批量自动化操作,可以极大提高办公和学习效率 ...
- 我悄咪咪告诉你:罩杯越小的妹子倾向买越贵的内衣~~Python爬取京东9000条内衣销售数据之数据关联度分析
将爬取的9000条内衣销售数据整理清洗后,基于Apriori关联算法,针对"罩杯和消费价格倾向这两个元素有无关系"这个问题进行分析 上一篇用数据库清洗数据,点这里 再上一篇爬取数据 ...
- python 24位图转 8位_Python爬取PPT模板小工具下载-Python爬取PPT模板小工具免费版下载v1.0...
由于很多PPT抓取工具都会因为版本问题无法使用,所以论坛大神就自己写了这款Python爬取PPT模板小工具,可以帮助用户轻松获取各种PPT模板,使用的时候注意一次只能下载一种类型.软件仅供交流学习,下 ...
- Python爬取小姐姐美照
大家好 我是阿喵 今天教大家用如何用爬虫爬取可爱小姐姐的美照 第一步:现将python环境搭建好,工欲利其事必先利其器! 第二步:寻找目标网站,我选择的网站是http://www.win4000.c ...
- python爬取微信小程序(实战篇)_爬虫爬取微信小程序
之前打算做个微信小程序的社区,所以写了爬虫去爬取微信小程序,后面发现做微信小程序没有前途,就把原来的项目废弃了做了现在的网站观点,不过代码放着也是放着,还不如公开让大家用,所以我把代码贴出来,有需要的 ...
最新文章
- boundingRectWithSize 的使用
- 专访闪送联合创始人于红建:要继续深耕国内市场
- 小功能隐藏着大学问---windows的ACL带来的挑战
- MySQL 中的三中循环 while loop repeat 的基本用法
- sql2000数据类型对应的数值_Qlikview---数据类型
- 人工蜂群算法的最小搜索模型_【优化求解】人工蜂群ABC算法
- CodeForces - 416A Guess a number
- 总结的AngularJS1版本的一些面试问题
- AIDA64 Extreme Edition(硬件检测)多国语言绿色特别版
- linux win10五笔码表,Win10五笔助手下载_WubiLex微软五笔助手下载免费版9.9.6.0 - 系统之家...
- 【Ghost Explore】镜像文件查看器
- C/S架构系统的自动更新功能设计与实现(四)
- 关于小米笔记本pro频繁蓝屏问题
- mqtt java教程_MQTT X 使用指南
- Gin渲染html模板报错:ends in a non-text context: {stateHTMLCmt delimNone urlPartNone jsCtxRegexp attrNone
- 日本房地产泡沫 Japan Real Estate Bubble
- r语言使用linux命令,技术|如何在 Ubuntu 上安装和使用 R 语言
- 什么是系统建模语言(SysML)?
- 软件开发及计算机基础
- html内联样式(表),外部样式表
热门文章
- html中align属性的justify,css text-align属性简介说明
- 在线markdown编辑器生成甘特图,太爱了
- 文本生成 计算机语言,自然语言处理 -- 文本生成概述
- 思比科系列CMOS图像传感器应用方案分析
- 金融机构系统性风险分析(Domestic+MES模型)200701-202012
- 云运维拓扑图_云计算中心拓扑图
- css 中多个class选择器的详解
- python运维招聘_利用 Python 爬取了 13966 条运维招聘信息,看看你是否符合招聘信息!...
- 美国国家标准与技术实验室对云计算的定义
- 揭秘微软树屋,员工可在里面开会、工作、晒日光浴