python爬取去哪里_Python爬取去哪儿网热门旅游信息
import requests
from pyquery import PyQuery as pq
#让使用者自行输入要查询的旅游地
travel_name =input("请输入你要查询的一日游旅游地信息,如(成都):")
#设置循环两页
for page in range(1,3):
# 网页的地址。把keyword和page后面的值设置为填充值
url = 'https://piao.qunar.com/daytrip/list.htm?keyword={}®ion=&from=mdl_search&sort=&page={}'.format(travel_name,page)
# 请求头 浏览器类型
headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.9 Safari/537.36"}
# 向网址发送请求
res = requests.get(url,headers=headers).text
#print(res)
# 数据初始化
doc =pq(res)
# 通过类选择器获取旅游项目,项目价格以及评分信息
name =doc(".name")
sight_item_price=doc(".sight_item_price")
relation_count=doc(".relation_count")
#然后我们用items()将数据转换成能够被遍历的数据
# 通过类选择器获取旅游项目,项目价格以及评分信息
name =doc(".name").items()
sight_item_price=doc(".sight_item_price").items()
relation_count=doc(".relation_count").items()
#print(name.text())
# 遍历旅游项目,项目价格以及项目名称
for x,s,f in zip(name,sight_item_price,relation_count):
# 将旅游项目信息转换为文本
name1=x.text()
#将项目价格转换为文本
sight_item_price1=s.text()
# 将评分信息转换为文本
relation_count1=f.text()
#将旅游项目,项目价格以及评分信息拼接起来
travel =(name1+sight_item_price1+relation_count1)
print(travel)
# 打开“去哪儿网”文件夹,保存为“广州一日游.txt”,"a"追加的方式,编码为utf-8
# 打开“去哪儿网”文件夹,保存为“xx一日游.txt”,"a"追加的方式,编码为utf-8
f =open('./'+'{}一日游'.format(travel_name)+'.txt',"a",encoding="utf-8")
# 写入旅游信息
f.write(travel+"\n")
# 关闭文件写入
f.close()
python爬取去哪里_Python爬取去哪儿网热门旅游信息相关推荐
- 【爬虫】用Python爬取去哪儿网热门旅游信息(并打包成旅游信息查询小工具)
以下内容为本人原创,欢迎大家观看学习,禁止用于商业用途,谢谢合作! ·作者:@Yhen ·原文网站:CSDN ·原文链接:https://blog.csdn.net/Yhen1/article/det ...
- python爬取虾米音乐_Python爬取620首虾米歌曲,揭秘五月天为什么狂吸粉?!
最近两天,我被朋友圈的五月天粉丝(五迷)疯狂刷屏,"五月天永远陪你到20岁""演唱会即视感",这些字眼让我恨不得马上奔到电影院打卡. 作为五迷,我是满怀激情地在 ...
- python 柱状图上显示字体_Python爬取百部电影数据,我发现了这个惊人真相!
2019年就这么匆匆过去了,就在前几天国家电影局发布了2019年中国电影市场数据,数据显示去年总票房为642.66亿元,同比增长5.4%:国产电影总票房411.75亿元,同比增长8.65%,市场占比 ...
- python爬取手机微信_Python爬取微信好友
前言 今天看到一篇好玩的文章,可以实现微信的内容爬取和聊天机器人的制作,所以尝试着实现一遍,本文记录了实现过程和一些探索的内容 itchat安装 对微信的控制可以使用itchat来实现,我们找到itc ...
- python爬取豆瓣书籍_python 爬取豆瓣书籍信息
继爬取 猫眼电影TOP100榜单 之后,再来爬一下豆瓣的书籍信息(主要是书的信息,评分及占比,评论并未爬取).原创,转载请联系我. 需求:爬取豆瓣某类型标签下的所有书籍的详细信息及评分 语言:pyth ...
- python爬取动态网页_python爬取动态网页数据,详解
原理:动态网页,即用js代码实现动态加载数据,就是可以根据用户的行为,自动访问服务器请求数据,重点就是:请求数据,那么怎么用python获取这个数据了? 浏览器请求数据方式:浏览器向服务器的api(例 ...
- python爬取歌曲评论_python 爬取歌曲评论的简单示例
这篇文章主要为大家详细介绍了python 爬取歌曲评论的简单示例,具有一定的参考价值,可以用来参考一下. 感兴趣python 爬取歌曲评论的简单示例的小伙伴,下面一起跟随512笔记的小编罗X来看看吧. ...
- python爬取网站新闻_Python爬取网站新闻
###准备### 本实例使用辅助工具Fiddler抓取网页数据和使用文档查看工具sublime正则过滤(也可使用其它文档编辑工具),python开发工具使用Pycharm编辑 我们选取搜狐网的新闻页面 ...
- python房价数据分析统计服_Python 爬取分析全国 12 个城市 4 万条房价信息,告诉你该怎样买房?...
原标题:Python 爬取分析全国 12 个城市 4 万条房价信息,告诉你该怎样买房? 作者 | 月小水长 责编 | 伍杏玲通过分页.线程池.代理池等技术,快速爬取链家网近4万条在售二手房信息,速度可 ...
最新文章
- 软件自动测试框架,软件自动化测试框架的研究和实现
- sphinx 源码阅读之分词,压缩索引,倒排——单词对应的文档ID列表本质和lucene无异 也是外部排序再压缩 解压的时候需要全部扫描doc_ids列表偏移量相加获得最终的文档ID...
- 设置域名_详解在nginx中设置三级域名的方法示例
- PHPUnit简介及使用(thinkphp5的单元测试安装及使用)
- 第16章:MongoDB-聚合操作--聚合管道--$project
- JavaScript初学者系列一:JavaScript基础(上)
- 20145305 《信息安全系统设计基础》第13周学习总结
- html图片使用glide,jQuery响应式幻灯片插件jquery.glide.js(支持触摸轻量级)
- php实现弱类型,PHP内核探索:弱类型变量的实现
- 使用索引的技巧知识点
- (翻译)UIP Application Block学习系列(三)UIP概念
- 老兵戴辉:华为操作系统28年史
- win10 3dmax 激活后反复激活和激活码无效问题
- 搭建物联网服务器基于nodejs
- 既往不恋,当下不杂,未来不迎
- h3c 云服务器操作系统,产品技术-H3C CloudOS云操作系统电信版-新华三集团-H3C
- 一块自制自行车码表从B站火到GitHub,稚晖君点赞,网友催量产
- 如何查看电脑的SN码?
- Pinia(小菠萝)使用方法
- js仿苹果风格弹出框alert插件