使用Chrome开发者工具精确定位网页元素位置

在学习使用python爬虫时,本人需要编写正则表达式,为精确找到所需要爬取数据的元素位置,学习使用Chrome开发者调试工具精确定位网页元素位置。

1. 使用Chrome开发者工具

  • ① 找到需要精确定位的网页,F12键直接打开开发者模式;或者找到Chrome浏览器的“更多工具”中的“开发者工具”,如下图所示(这里以百度界面为例):

    进入需要的网站(这里以电影天堂网站为例),成功打开之后,界面如下:
  • ②进入“元素选项”,之后点击谷歌开发者工具左上角的箭头,即可选定自己所需要的元素位置。这里本人目的是找到每个电影的“a”的位置,效果如下:
  • ③选中所需元素位置,鼠标右键复制XPATH路径:
  • ④ctrl + F 快捷键打开Chrome的查询框,将复制的XPATH信息复制进搜索框,检索成功之后会进行高亮显示(如下图的右下角所示)。
    这里复制的XPATH为://*[@id=“header”]/div/div[3]/div[3]/div[2]/div[2]/div[2]/ul/table[1]/tbody/tr[2]/td[2]/b/a

2. 适当修改XPATH

可以看出,上图显示只可以定位到一个元素,这样并不能满足我们查找全部的要求的,所以我们需要适当修改XPATH。
  • ① 在修改XPATH之前需要先简单熟悉一下XPATH语法(具体需要自己查资料),XPath 是一门在 XML 文档中查找信息的语言,这里只展示它的简单语法:
  • ② 总结网页规律,修改XPATH
    原XPATH://[@id=“header”]/div/div[3]/div[3]/div[2]/div[2]/div[2]/ul/table[1]/tbody/tr[2]/td[2]/b/a
    修改后XPATH://
    [@id=“header”]/div/div[3]/div[3]/div[2]/div[2]/div[2]/ul/table/tbody/tr[2]/td[2]/b/a
    可以看出这里我仅仅把“table[1]”改成了“table”,意思是定位“ul”标签下的所有table标签。之后将修改后的XPATH复制到查询框,即可快速定位到“a”元素位置,可以看到共查询到25个:

总结

    本文主要介绍了Chrome开发者工具的元素定位功能和根据需要修改XPATH路径信息。这里使用 Chrome 开发者调试工具来精准定位要抓取信息的元素结构。之所以这样做,是因为这能避免正则表达式的冗余,提高编写正则表达式的速度和精确性。

使用Chrome开发者工具精确定位网页元素位置相关推荐

  1. SAP UI5 应用开发教程之三十七 - 使用 Chrome 开发者工具 Console 面板进行元素审查试读版

    一套适合 SAP UI5 初学者循序渐进的学习教程 教程目录 SAP UI5 本地开发环境的搭建 SAP UI5 应用开发教程之一:Hello World SAP UI5 应用开发教程之二:SAP U ...

  2. HTML开发者工具抓取所有图片,利用Chrome开发者工具功能进行网页整页截图的方法...

    说起要截取整个网站页面,很多朋友第一时间想到的都是用哪款chrome扩展,确实,我们网站之前也有介绍过一些截图插件比如: 但其实现在不少浏览器都自带截屏功能了.尤其是像chrome如此强大的浏览器,比 ...

  3. 使用 Chrome 开发者工具进行 JavaScript 问题定位与调试

    引言 Google Chrome 是由 Goole 公司开发的一款网页浏览器,自 2008 年 9 月第一个测试版本发布以来,其市场占有率逐步上升,至 2014 年 5 月,Chrome 已超越 Fi ...

  4. SAP UI5 应用开发教程之三十八 - 使用 Chrome 开发者工具查看程序执行出错时的上下文信息

    一套适合 SAP UI5 初学者循序渐进的学习教程 教程目录 SAP UI5 本地开发环境的搭建 SAP UI5 应用开发教程之一:Hello World SAP UI5 应用开发教程之二:SAP U ...

  5. 请参阅:Chrome开发者工具中的悬停状态

    我希望看到:hover我在Chrome中徘徊的锚点的:hover样式. 在Firebug中,有一个样式下拉列表,允许我为元素选择不同的状态. 我似乎无法在Chrome中找到类似内容. 我错过了什么吗? ...

  6. 小技巧:Chrome开发者工具里的Alt+单击

    在Chrome开发者工具里单击一个元素左边的小三角符号,只会展开其继承结构的第一层直接子节点: 而Alt+Click,可以将该元素第一个子节点,以及该子节点原型链上的节点全部展开.将下图和上图进行比较 ...

  7. Chrome 开发者工具审查元素快捷键

    打开DEVTOOLS 你可以通过以下任何一种方式来访问DevTools: 打开浏览器右上角的Chrome菜单 ,然后选择"更多工具"–"开发者工具". 在页面任 ...

  8. Chrome开发者工具中Elements(元素)断点的用途

    2019独角兽企业重金招聘Python工程师标准>>> SAP Engagement Center UI的这个按钮会每秒钟刷新一次,显示页面已经打开了多长时间. 需求:需要找到哪行J ...

  9. 使用Chrome开发者工具调试Android端内网页(微信,QQ,UC,App内嵌页等)

    使用Chrome开发者工具调试Android端内网页(微信,QQ,UC,App内嵌页等) 传送门 转载于:https://www.cnblogs.com/momozjm/p/9389912.html

  10. 精确定位网页中各个元素的位置

    精确定位网页中各个元素的位置有两种方法:使用表格或层.使用表格是目前比较通用的做法,具体方法是:先在网页中建立一个表格,注意表格的边框宽度应为0.然后再把各个元素按照你的要求放在各个表格单元之中.仔细 ...

最新文章

  1. mSystems和Microbiology Spectrum杂志“肠道微生态专题”论文征稿
  2. PV、UV、UIP、VV、CPC、CPM、RPM、CTR指的是什么?
  3. (String) 和 String.valueOf() 两种字符串转换的区别
  4. Hello,Views(六)下拉框Spinner(附源码)
  5. Oracle中drop_column的几种方式和风险
  6. 性能优化之页面缓存(以Javascript方式缓存页面部件)
  7. TensorFlow基础篇(四)—— tf.nn.relu()
  8. [Ubuntu18.04]使用snap
  9. QT+VS开发界面入门(qt界面在VS2022实现自动生成槽函数)
  10. HDCP认证过程-收集网上的,作为记录
  11. SPSS软件入门常识
  12. 微博白名单,微博外链白名单,微博白名单域名
  13. android 美团支付方式,美团外卖怎么用支付宝支付 美团用支付宝付款的设置方法...
  14. 牛客寒假集训营 牛牛战队的比赛地
  15. 安装mysq的时候执行mysqld --initialize --console时候报错:can not create directory data文件夹需要把分隔符改成反方向
  16. 基于testNG的数据驱动测试的自动化测试实践(一)
  17. Pcie(igb)网卡调试总结:tx uint hang异常解决方法
  18. 数据结构-树结构-哈夫曼应用-修理牧场
  19. 45-js操作DOM和bom操作
  20. SysML图例-核聚变

热门文章

  1. 新年,未知的开始---Created by 思贤泪自潸
  2. 基因芯片(Affymetrix)分析3:获取差异表达基因
  3. 开放api接口平台:appid、appkey、appsecret
  4. android高仿股票源码,StockChart 自定义股票行情图,高仿某币 app 行情图 @codeKK Android开源站...
  5. mybatis中的when,then,end的用法
  6. SaaS 公司融资的「22条军规」
  7. excel 画散点图 怎么设置图片的分辨率_最全的Excel图表的基本类型与选择
  8. searchEngin_设置bing国际版为默认引擎
  9. Linux实战——Shell编程练习(更新12题)
  10. java 值传递 引用传递的理解 言简意赅 一字千金