python爬取旅游信息_用Python爬取了全国近5000家旅游景点,分析国庆去哪玩
2020 国庆马上就要到了
我想今年大家在家都憋坏了
今年国庆和中秋刚好又是同一天,加起来有 8 天假
这么长的假期,当然是出去 玩玩玩!
但是每次长假期间,你有没有想起被人山人海支配的恐惧呢?
那么该去哪些地方呢?
下面我用 Python 爬取了全国近 **5000 **个旅游景点,并结合 **pyecharts **来做分析
技能包
爬虫
Mysql
sqlalchemy
pyecharts
数据爬取
旅游景点的数据是从网上爬取的,该数据包含以下维度:景点名称,所属省市区,景点简介,门票价格,评分,近期销量,景点评级等。
爬虫比较简单,多分析下就可以,直接贴代码了
爬虫代码
基本上没什么反爬,加点延时别爬太快就是了...
爬取下来之后直接入库,入库部分代码如下:
入库
当然,每个省份我只爬了前 10 页,因为后面的基本都是些不知名的旅游景点
爬完之后看了下数据库有 4572 条数据,我想应该够了吧...
有了数据之后,是不是就能搞事情了...,简单做几个分析
数据分析
接下来我们使用 pyecharts 来对爬取的数据做一个简单的分析
1. 景点销量排行榜
直接从数据库查出数据,丢进去就行。
结果展示:
2. 景点评级排行榜
假期这么长,想玩的地方有很多!如何选择一个景点多的地方并且评级高的
这样就能在一个地方尽情的玩耍,而不用四处奔波
我们不妨来看看各省市能排的上号的景点有多少吧!
代码如下:
将数据查询出来后作一个简单的清洗,统计各省份 4A 级以上景点数量
一起来看看吧
再将这些数据放到地图上看看..更加直观
3.各省销量排行榜
通过该数据,可以看出哪些省市区的人会比较多...
这样就能避免去人山人海的地方看人人人人.。。
综合分析
最终考虑去哪儿,可能需要多维度的分析。
所有,我把价格,评分,销量这三个维度放在一起
当然,你也可以选择你关心的维度来..最好自己动手试试
这样印象深刻!
来看看效果把:
重点关注下销量高,评分高,价格合适的...
提前祝大家国庆有个美好的假期!
相关文章可点击查看:
python爬取旅游信息_用Python爬取了全国近5000家旅游景点,分析国庆去哪玩相关推荐
- 用Python爬取了全国近5000家旅游景点,分析国庆去哪玩
双节同庆,小长假如约而至 我想今年大家在家都憋坏了 这么长的假期,当然是出去 玩玩玩! 每当长假的时候,有没有想起被人山人海支配的恐惧! 该去哪些地方呢? 我用 Python 爬取了全国近 5000 ...
- 国庆小长假来点不一样的,如何用Python爬取了全国近5000家旅游景点,一起来看
2020 国庆马上就要到了 我想今年大家在家都憋坏了 今年国庆和中秋刚好又是同一天,加起来有 8 天假 这么长的假期,当然是出去 玩玩玩! 但是每次长假期间,你有没有想起被人山人海支配的恐惧呢? 那么 ...
- python爬取旅游信息_用Python爬取分析全国旅游数据-Go语言中文社区
前言: Python对于本人来讲也是一个在逐渐学习掌握的过程,这次的内容就从旅游开始讲起,进入正文前首先附(fang)上(du)最令我垂涎欲滴的海鲜盛宴. 数据爬取: 最近几天朋友圈被大家的旅行足迹刷 ...
- python自动抓取指定信息_使用python自动转发抓取的网页信息
1.[代码][Python]代码 # -*- coding: utf-8 -*- from selenium import webdriver import time from email.heade ...
- python读取日志错误信息_使用Python将Exception异常错误堆栈信息写入日志文件
假设需要把发生异常错误的信息写入到log.txt日志文件中去: import traceback import logging logging.basicConfig(filename='log.tx ...
- python批量录入学生信息_利用Python实现学生信息管理系统的完整实例
项目要求: 读完题目,首先我们要确定程序思路 我们要全部通过类去实现 也就是 我们要实现管理员.学生.讲师.课程.教师五个类 管理员类 class Administration(object): de ...
- python字典输入学生信息_用Python创建一个学生字典并可以查询其中信息
展开全部 你可以试试这个---------------------------------------------------------- # -*- coding:UTF-8 -*- studen ...
- python读取微信群信息_利用Python转发微信群通知信息
案例:作为班长需要实时转发年级群发布的有关通知.文件到自己班的微信群,这种无脑的重复性工作适用于编写脚本自动帮忙处理. 准备:服务器(可选择阿里云学生服务器).itchat模块.一颗爱折腾的心 代码: ...
- 国庆去哪玩?用Python爬取了全国5000家旅游景区(记得收藏)
2020 国庆马上就要到了 我想今年大家在家都憋坏了 今年国庆和中秋刚好又是同一天,加起来有 8 天假 这么长的假期,当然是出去 玩玩玩! 但是每次长假期间,你有没有想起被人山人海支配的恐惧呢? 那么 ...
最新文章
- hdu1914 稳定婚姻问题
- 阿里巴巴 Kubernetes 应用管理实践中的经验与教训
- 新时代营销解决方案:敏捷BI助力银行高效精准营销
- ASP.NET Core 借助 Helm 部署应用至 K8S
- javafx 浏览器_浏览器中的JavaFX
- python 生成pdf_如何使用Python生成PDF?
- linux中死锁的概念,【Linux】死锁概念总结
- 北京四中院在线裁定一起跨国离婚案
- SCOM监控APC-UPS不间断电源设备
- c++虚函数动态联编需要避免的内存泄漏问题
- java学生管理系统登录注册_Java程序---学生管理系统的登录和注册
- h计算机软件指什么,stdio.h 是什么意思?
- KEIL C51出现 runtime error R6002 floating point support not loaded解决办法
- Windows系统为指定用户设定本地组策略
- KMeans算法流程
- 解决fegin post requestbody 400报错问题
- PHP小白编程学习——第三方登录功能设计思维
- Excel 中超链接转换为相应的 URL
- cas4.2登出后,跳转指定链接
- Python 面试问题总结