前情提要:

  上节学过从网上获取请求,获取返回内容,带理

获取内容之后,第二部就是获取请求的数据分析

  一:xpath 语法

 浏览器一般会自带xpatn 解析

这里大概讲述一下xpath 的基本操作

二:式例

我用的是360 浏览器...(..用了好多年了..习惯了..)

我们拿笔趣阁进行测试

https://www.biquge5200.cc/46_46254/

1>进入开发者模式

2>写xpath

 >2.1

  //        获取子孙节点

    div        div  节点

  //          获取上一层下的子孙节点

  dl          dl  节点

  //            获取上一层下的子孙节点

  dd         dd节点

  [position()]             节点内的位置

  >                            比较运算符

  9                             第九个节点

三: lxml 解析器

# 本地使用
# from lxml import etree
# htmlElent =etree.HTML(text)
# print(type(htmlElent))  #html对象
# print(etree.tostring(htmlElent,encoding='utf-8').decode('utf-8'))# etree.tostring 规范化并补全#读取文件中的html
# from lxml import etree
# parser =etree.HTMLParser(encodeing=('utf-8'))  #定义解析器
# #解析器作用 补全html 和规范html
# htmlElent =etree.parse("lagou.html",parser=parser)
# # 读取本地html 文件. 传入解析器
# print(etree.tostring(htmlElent,encoding='utf-8').decode('utf-8'))

转载于:https://www.cnblogs.com/baili-luoyun/p/10426842.html

请求数据分析 xpath语法 与lxml库相关推荐

  1. python xpath语法-Python爬虫基础之XPath语法与lxml库的用法详解

    前言 本来打算写的标题是XPath语法,但是想了一下Python中的解析库lxml,使用的是Xpath语法,同样也是效率比较高的解析方法,所以就写成了XPath语法和lxml库的用法 XPath 即为 ...

  2. Python 爬虫利器三之 Xpath 语法与 lxml 库的用法

    原文链接https://cuiqingcai.com/2621.html 前言 前面我们介绍了 BeautifulSoup 的用法,这个已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxm ...

  3. Python 中 xpath 语法 与 lxml 库解析 HTML/XML 和 CSS Selector

    The lxml.etree Tutorial :https://lxml.de/tutorial.html python3 解析 xml:https://www.cnblogs.com/deadwo ...

  4. python爬虫(8)--Xpath语法与lxml库

    1.XPath语法 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历.XPath 是 W3C XSLT 标准的主要元素,并且 XQuery ...

  5. 10.16 my学习日记 (XPath的基础语法,lxml库的应用)

    10.16 my学习日记(XPath的基础语法,lxml库的应用) XPath的基础语法 XPath查找标签 XPath谓语 lxml库在爬虫中的应用 etree库etree_Element对象 使用 ...

  6. python xpath语法-Python爬虫之XPath语法和lxml库的用法

    本来打算写的标题是XPath语法,但是想了一下Python中的解析库lxml,使用的是Xpath语法,同样也是效率比较高的解析方法,所以就写成了XPath语法和lxml库的用法 安装 为什么要用这个库 ...

  7. python网络爬虫系列教程——python中lxml库应用全解(xpath表达式)

    全栈工程师开发手册 (作者:栾鹏) python教程全解 python网络爬虫lxml库的应用全解. 在线安装方法:cmd中输入"pip install lxml" 离线安装,下载 ...

  8. 爬虫之 lxml模块和xpath语法

    爬虫之 lxml模块和xpath语法 对html或xml形式的文本提取特定的内容,就需要我们掌握lxml模块的使用和xpath语法. lxml模块可以利用XPath规则语法,来快速的定位HTML\XM ...

  9. Xpath语法(xml解析)

    Xpath语法 from lxml import etree # 需要下载lxml第三方模块 1.xpath基本概念 1)树:整个HTML(xml)代码结构就是一个树结构 2)节点:树结构中的每一个元 ...

最新文章

  1. Radware负载均衡项目配置实战解析之四-VRRP双机配置与同步
  2. (转)IntelliJ Idea 的相关使用
  3. sql_INSERT DELETE
  4. 微信内置浏览器无法清除缓存问题
  5. IE8 CSS HACK 兼容集合
  6. [How TO]-如何使用Sphinx编写漂亮的文档
  7. 华为将升级鸿蒙,华为将弃用安卓?Mate40将成为首款可升级鸿蒙OS的手机
  8. matlab计算位温,大气物理学复习资料
  9. 04.卷积神经网络 W1.卷积神经网络
  10. java的三个环境变量是啥_JAVA中常用需要设置的三个环境变量(JAVA_HOME、CLASSPATH、PATH)...
  11. TiFlash:并非另一个 T + 1 列存数据库
  12. 国内成品油价近期历次调整一览
  13. Android JNI(二)——实战JNI入门之Hello World
  14. javascript Control flow(控制语句)
  15. java resourcebundle_java.util.ResourceBundle使用详解
  16. 使用CME2配置Copley驱动器,带Maxon电机
  17. 更改MSN Live Spaces登录帐号
  18. MP3参数,格式,术语有关一切内容详解
  19. 冬训成果何在?林丹无缘新赛季首冠状态成迷
  20. 如何实现转圈圈动画效果

热门文章

  1. python3ide_Python IDE Windows下载3.4.2 安装版
  2. linux双核对线程,Linux检查双核(及多核)CPU信息
  3. c#如何通过ftp上传文件_ftp自动上传文件,如何设置ftp自动上传文件及环境配置...
  4. python input函数赋值法_大佬们 我是刚开始学python的小白 遇到这种赋值方式 实在不懂这个a+b是赋值给谁的 求解...
  5. 不能执行已释放 script 的代码_[漏洞预警]CVE20190708远程桌面代码执行漏洞利用工具已放出...
  6. Linux 利用nginx源码编译安装nginx
  7. matplotlib库绘图基础
  8. 快搜浏览器_郑秀晶因腿粗再上热搜:怎么减肥才能不反弹?
  9. 模拟进程创建、终止、阻塞、唤醒原语_操作系统基础8-进程及进程控制
  10. 全民大乐斗场服务器状态,看到最近很多人问重修,**说一下这个问题