今天的目标是各地旅游景点

废话不多说,直接开始

由于本次爬取后的数据保存到Excel,所以要提前安装相关库,这里我用的是pip

win+R cmd到命令行输入以下内容(要确保python环境正常)

pip install Workbook

pip install openpyxl

接下来就可以开始代码操作了

# -- coding: utf-8 --
import requests
from lxml import html
from openpyxl import Workbook#创建Excel
wb=Workbook()
ws=wb.active#获取数据
url='https://place.qyer.com/china/citylist-0-0-1/'def getpage(url):#请求头,模拟浏览器登录headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.88 Safari/537.36'} #访问链接,获取HTMLr = requests.get(url, headers=headers)retext = r.text# 解析数据ht = html.fromstring(retext)#使用xpath获取city = ht.xpath('/html/body/div[5]/div/div[1]/ul/li')for i in city:name = i.xpath('./h3/a/text()')[0]beento = i.xpath('./p[@class="beento"]/text()')[0]list = i.xpath('./p[@class="pois"]/a/text()')list2 = ''# for j in list:#     list2=list2+','+j.strip()# print(name,beento,list2[1:])list = [place.strip() for place in list]list2 = ','.join(list)datalist = [name, beento, list2]ws.append(datalist)for i in range(1,10):url='https://place.qyer.com/china/citylist-0-0-{}/'.format(i)getpage(url)#Excel保存
fileanme="D:\Python\Project\test4" #路径可以自己设置,我这里是python源文件同级目录
wb.save("旅游景点.xlsx")

运行代码

python爬虫旅游景点相关推荐

  1. 基于Python的旅游景点的数据采集与分析的研究

    在旅游景点不断扩张,本基于Python的旅游景点的数据采集与分析系统按照软件开发方法进行研究,对系统先进行需求分析,确定系统必须做什么,进而进行系统设计,设计出满足需求的新系统,最后才是系统功能实现以 ...

  2. Python 获取旅游景点信息及评论并作词云、数据可视化

    正所谓:有朋自远方来,不亦乐乎?有朋友来找我们玩,是一件很快乐的事情,那么我们要尽地主之谊,好好带朋友去玩耍!那么问题来了,什么时候去哪里玩最好呢,哪里玩的地方最多呢? 今天将手把手教你使用线程池爬取 ...

  3. 基于Python热门旅游景点数据分析系统设计与实现

    博主介绍: ✌全网粉丝30W+,csdn特邀作者.博客专家.CSDN新星计划导师.java优质创作者,博客之星.掘金/华为云/阿里云/InfoQ等平台优质作者.专注于Java技术领域和毕业项目实战 ✌

  4. python爬虫--租房信息

    对小猪住房网站的信息爬取 一.准备 二.爬取的内容明细 三.这里直接写代码 四.输出结果 一.准备 谷歌浏览器打开 http://bj.xiaozhu.com/fangzi/37609773603.h ...

  5. python Django基于物品协同过滤旅游景点推荐论坛系统

    python Django基于物品协同过滤旅游景点推荐论坛系统 Python Django基于物品推荐协同过滤旅游景点推荐论坛系统 python Django旅游景点论坛 Python Django旅 ...

  6. python爬虫--招聘信息

    对职友集招聘网站的爬虫 一.对职友集的python爬虫 代码如下: 输出结果: headers错误信息处理 一.对职友集的python爬虫 由于网页更新标签,现在(20190605)更新代码,可以正常 ...

  7. [Python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒

    前面我讲述过如何通过BeautifulSoup获取维基百科的消息盒,同样可以通过Spider获取网站内容,最近学习了Selenium+Phantomjs后,准备利用它们获取百度百科的旅游景点消息盒(I ...

  8. python爬虫可以爬取个人信息吗_手把手教你利用Python网络爬虫获取旅游景点信息...

    爬虫系列: 当我们出去旅游时,会看这个地方有哪些旅游景点,景点价格.开放时间.用户的评论等. 本文基于Python网络爬虫技术,以hao123旅游网为例,获取旅游景点信息. 1.项目目标 获取网站的景 ...

  9. 【爬虫实战项目】Python爬虫批量旅游景点信息数据并保存本地(附源码)

    前言 今天给大家介绍的是Python爬虫批量下载旅游景点信息数据,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是这样 ...

最新文章

  1. 用iframe实现局部刷新的各种跳转方法(网上总结)
  2. Android进阶笔记09:Android 万能适配器
  3. SUMO 设置车辆的换道模型
  4. vue动态生成表单元素
  5. java中如何计算两个时间段的月份差
  6. 第二阶段冲刺 每日站立会议 1/4
  7. 比特斯拉酒瓶更贵!小鹏汽车推出“金属麻将”:1999元
  8. 6.8 2.23-2.26
  9. 百度课程——基于深度学习的自然语言处理
  10. 操作系统随机密码,定时改密码
  11. 智百威收银系统服务器连接不上,收银系统进入不了收银系统怎么办 – 手机爱问...
  12. Kali Linux 安装网易云音乐打不开的解决方法
  13. lowB三人组---冒泡排序原理和实现
  14. 搭建电信之“云”需从基础入手 业务拓展紧跟市场需求
  15. 动画animate的使用
  16. 2019届华为实习生招聘
  17. 河北金融计算机网络基础在线6.1.3,2016秋大学计算机基础(河北金融学院)
  18. 足球赛积分管理系统c语言,足球赛计时计分器课程设计报告.doc
  19. SAP 簇表 A017 物料信息记录 (指定工厂) 包含的透明表
  20. ARM处理器的工作模式。

热门文章

  1. 第十一届中国创新创业大赛浙江赛区暨第九届浙江省“火炬杯”创新创业大赛-新一代信息技术行业总决赛
  2. 自考吧计算机及应用,想自考计算机本科,是计算机及应用还是计算机网络好?...
  3. 外星人 m18参数配置 外星人 m18怎么样
  4. 关于spark yarn模式下的常用属性
  5. 计算机硬件技术的应用毕业论文,计算机硬件技术论文
  6. linux 后台运行程序命令
  7. cocos2dx下载安装
  8. “数字孪生”十问:从概念到应用
  9. IMT-Advanced频率需求计算方法及结果(转)
  10. shell 文件头尾添加字符串