爬取站点

任意一个携程酒店的详细链接,这里给出了四个,准备开四个线程爬取:

https://hotels.ctrip.com/hotel/6278770.html#ctm_ref=hod_hp_hot_dl_n_2_7

https://hotels.ctrip.com/hotel/6657909.html#ctm_ref=hod_hp_hot_dl_n_2_8

https://hotels.ctrip.com/hotel/441351.html#ctm_ref=hod_hp_hot_dl_n_2_1

https://hotels.ctrip.com/hotel/5470972.html#ctm_ref=hod_hp_hot_dl_n_2_3

准备工作

Python版本:Python3.6

安装selenium模块:

pip3 install selenium

安装lxml模块:

pip3 install lxml

使用到的知识

selenium模块的使用

Xpath的使用

多线程

IO

代码

from selenium import webdriver

from selenium.webdriver.common.keys import Keys

from selenium.webdriver import ActionChains

import time

import os

from lxml import etree

import threading

import base64

# 爬取一个站点的评论信息

<

python携程酒店评论_Python基于selenium爬取携程酒店评论信息相关推荐

  1. java 爬取评论,Java基于WebMagic爬取某豆瓣电影评论的实现

    目的 搭建爬虫平台,爬取某豆瓣电影的评论信息. 准备 webmagic是一个开源的Java垂直爬虫框架,目标是简化爬虫的开发流程,让开发者专注于逻辑功能的开发.webmagic的核心非常简单,但是覆盖 ...

  2. 基于selenium爬取去哪儿酒店信息

    去哪儿网站中,要爬取旅游的酒店信息,我们用通常的requests库进行爬取的时候发现,当我们要翻页的时候网址未出现变化,返回的网页源码信息始终只有第一页的内容,那么有没有一种方式可以使得能够翻页爬取呢 ...

  3. python提取支付宝的账单_python通过adb爬取支付宝移动端账单信息

    python通过adb连接爬取支付宝移动端的账单信息,操作过程如下: 于是此文件就可以分解为如下四个主要功能: 1.图片识别;2.模拟点击;3.模拟滑动;4.截图功能 一.对账单详情页的处理: 对账单 ...

  4. Selenium爬取网易云音乐评论

    Selenium爬取网易云音乐评论 一.爬取工具 1.1 selenium ​ selenium这是一个第三方库我们可以通过 pip install selenium来安装这个第三方库. ​ Sele ...

  5. Python爬虫:最牛逼的 selenium爬取方式!

    Python爬虫:最牛逼的 selenium爬取方式! 作为一个男人 在最高光的时刻 这是小编准备的python爬虫学习资料,加群:700341555即可免费获取! Python爬虫:最牛逼的 sel ...

  6. python+selenium爬取链家网房源信息并保存至csv

    python+selenium爬取链家网房源信息并保存至csv 抓取的信息有:房源', '详细信息', '价格','楼层', '有无电梯 import csv from selenium import ...

  7. python抓取文献关键信息,python爬虫——使用selenium爬取知网文献相关信息

    python爬虫--使用selenium爬取知网文献相关信息 写在前面: 本文章限于交流讨论,请不要使用文章的代码去攻击别人的服务器 如侵权联系作者删除 文中的错误已经修改过来了,谢谢各位爬友指出错误 ...

  8. 利用selenium爬取携程旅游网的景区评论

    第一步:打开携程网,获取该景点的网址.以我的为例,我爬取的是湖北省 恩施州的恩施大峡谷景区的评论.网址为:https://you.ctrip.com/sight/enshi487/51386.html ...

  9. 利用selenium爬取携程酒店信息

    上节博客我们利用requests请求库,正则表达式来提取信息(链接https://mp.csdn.net/postedit/81865681),提到过使用selenium也可以抓取酒店信息,在这里利用 ...

最新文章

  1. C六:指针可以比较大小
  2. 是什么影响了MySQL性能?
  3. java 连接 sftp失败,与apache vfs的SFTP连接失败,但使用WinSCP成功
  4. vscode 安装包_VS Code的下载与安装(更改插件的安装位置)
  5. 为加快SAP Commerce Cloud在windows服务器上的启动速度,而禁用的一些服务
  6. [树结构]平衡二叉树AVL
  7. 用CMarkup类创建xml文件的方法
  8. sql date 函数_什么是SQL DATE()函数?
  9. ora-28500 ora-02063 mysql_ORA-01017/ORA-02063 DbLink建立错误问题分析及解决
  10. mysql 写undolog_Mysq bin redo undo log
  11. 沃特玛采集均衡模块_采集均衡模块以及电池管理系统_2016212573884_说明书_专利查询_专利网_钻瓜专利网...
  12. BS7799与ISO17799的发展历程
  13. Java五子棋全代码
  14. android 给apk下载地址,Android 7.0适配 APK文件下载及安装问题(FileProvider)
  15. 【c项目】网吧管理系统的设计和实现
  16. python的查找list的元素
  17. 大病众筹平台会成为下一个“网络诈骗”工具吗?
  18. nodejs调用java的jar包进行PPT转pdf
  19. 5分绩点转4分_搞笑图片集:这才是4个兄弟分5块饼的正确答案吧
  20. JavaFX之Scene Builder的使用(开发一款GUI小工具原来这么简单)

热门文章

  1. 关于GridView中按钮的commandargument使用
  2. 能进复试的情况下,浙大MBA提面优秀良好其它三档考生录取率一观
  3. 学习笔记2-ES6/TypeScript/JavaScript内存优化
  4. 如何给线程起名字呢?
  5. 第四代英特尔至强重磅发布,芯片进入下半场:软硬加速、绿色可持续
  6. 吃鸡邀请了队友显示服务器正忙,吃鸡怎么邀请好友_吃鸡拉好友组队开黑方法介绍_游戏吧...
  7. 《Pytorch学习指南》- Dataset和Dataloader用法详解
  8. 2022最新解决APK报毒的程序源码+安装教程
  9. ctfshow 萌新web10-21
  10. ARM处理器中CP15协处理器的寄存器1376698090