如何利用python在一个wen'dang'li_如何利用Python网络爬虫给自己跟朋友来一份穷游攻略!走到哪里穷到哪里的哦!...
【一、项目背景】
穷游网提供原创实用的出境游旅行指南、攻略,旅行社区和问答交流平台,以及智能的旅行规划解决方案,同时提供签证、保险、机票、酒店预订、租车等在线增值服务。穷游“鼓励和帮助中国旅行者以自己的视角和方式体验世界”。
今天教大家获取穷游网的城市信息,使用Python将数据写入csv文档。
【二、项目目标】
实现将获取对应的城市、图片链接、热点、批量下载 保存csv文档。
【三、涉及的库和网站】
1、网址如下:
https://place.qyer.com/south-korea/citylist-0-0-{}
2、涉及的库:requests、l****xml、fake_useragent、time、csv
【四、项目分析】
首先需要解决如何对下一页的网址进行请求的问题。可以点击下一页的按钮,观察到网站的变化分别如下所示:
https://place.qyer.com/south-korea/citylist-0-0-1
https://place.qyer.com/south-korea/citylist-0-0-2
https://place.qyer.com/south-korea/citylist-0-0-3
观察到只有citylist-0-0-{}/变化,变化的部分用{}代替,再用for循环遍历这网址,实现多个网址请求。
【五、项目实施】
1、我们定义一个class类继承object,然后定义init方法继承self,再定义一个主函数main继承self。准备url地址。
2、随机产生UserAgent。
3、多页请求。
4、定义get_page方法,进行数据请求。
5、定义page_page,xpath解析数据, for循环遍历数组。
在谷歌浏览器上,右键选择开发者工具或者按F12。右键检查,xpath找到对应信息的字段。如下图所示。
6、定义csv文件保存数据,写入文档。
7、在main方法调用。
8、time模块,设置时间延迟。
【六、效果展示】
1、点击运行,输入起始页,终止页。
2、将下载成功信息显示在控制台。
3、保存csv文档。
【七、总结】
1、不建议抓取太多数据,容易对服务器造成负载,浅尝辄止即可。
2、希望通过这个项目,能够帮助大家对csv文档处理有进一步的了解。
3、本文基于Python网络爬虫,利用爬虫库,实现穷游网的获取。实现的时候,总会有各种各样的问题,切勿眼高手低,勤动手,才可以理解的更加深刻。
4、可以根据自己的需要选择自己的喜欢的城市获取自己想要的有效信息 。
此文转载文,著作权归作者所有,如有侵权联系小编删除!
需要源代码或者想了解更多的(点击这里下载)
如何利用python在一个wen'dang'li_如何利用Python网络爬虫给自己跟朋友来一份穷游攻略!走到哪里穷到哪里的哦!...相关推荐
- python网络爬虫_一篇文章教会你利用Python网络爬虫获取穷游攻略
点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 [一.项目背景] 穷游网提供原创实用的出境游旅行指南.攻略,旅行社区和问答交流平台, ...
- 一篇文章教会你利用Python网络爬虫获取穷游攻略
[一.项目背景] 穷游网提供原创实用的出境游旅行指南.攻略,旅行社区和问答交流平台,以及智能的旅行规划解决方案,同时提供签证.保险.机票.酒店预订.租车等在线增值服务.穷游"鼓励和帮助中国旅 ...
- 10分钟教你利用Python网络爬虫获取穷游攻略
完整源码在底部 [一.项目背景] 穷游网提供原创实用的出境游旅行指南.攻略,旅行社区和问答交流平台,以及智能的旅行规划解决方案,同时提供签证.保险.机票.酒店预订.租车等在线增值服务.穷游" ...
- 如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)
前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...
- python朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)
前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...
- python抓取朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)...
原标题:如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下) 前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往 ...
- python爬虫微信朋友圈怎么发文字_如何利用Python网络爬虫抓取微信朋友圈的动态(上)...
今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...
- python抓取微信朋友圈动态_2018最全如何利用Python网络爬虫抓取微信朋友圈的动态...
今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...
- 2018最全如何利用Python网络爬虫抓取微信朋友圈的动态
今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...
最新文章
- 正则表达式语法规则收集
- 缓冲区溢出_在Java中使用Google的协议缓冲区
- CentOS 7源码安装httpd服务
- sign python_python实现sign签名
- java clex 中的 IloLPMatrix
- 玩转 SpringBoot 2 快速整合 | RESTful Api 篇
- 加密技术,给邮件安全加上一把锁
- windows系统bat批处理 电脑换IP清空dns地址 清空缓存重新获取ip
- Python中函数的用法
- Atitit 音频技术实践 艾提拉著 目录 1. 常用的通用技术	2 1.1. Nlp 云识别 api 爬虫技术	2 1.2. Html解析	2 1.3. ffmpege	2 1.4. jfug
- 最佳75个安全工具介绍及其下载地址
- php令牌桶,令牌桶限频(TokenBucket)
- 降压稳压器LM2596SX-ADJ技术参考
- 腾讯云云服务器IE浏览器初始使用常见问题
- python中、函数定义可以不包括以下一对圆括号_在python中,参数在函数定义的圆括号对内指定,用分号分割...
- 送学妹的生日礼物~ 制作一个超浪漫的告白3D相册(HTML+CSS+JavaScript)
- “WORD上次启动失败,以安全模式启动”的解决方法
- DBA的工作职责是什么?
- Spring Security | 轻松搞定认证授权~
- 计算机专业毕业文案,毕业微信朋友圈说说 2020毕业文案经典个性
热门文章
- cisco数据中心理论小记-3
- Android得到一个闹钟在第三方
- 你不了解PHP的10件事情
- 机器学习——人工神经网络之BP算法编程(python二分类数据集:马疝病数据集)
- 二阶振荡衰减 matlab,基于Matlab/Simulink的二阶控制系统仿真研究
- echarts折线图背景线_echarts设置折线线条颜色和折线点颜色的实例
- php代码加注释_怎么在php中添加注释
- java实现poi导入excel_Java POI实现将导入Excel文件的示例代码
- RE validation in Java EE
- 前端(jQuery UI)(2)-- jQuery UI interactions