总述:

一开始接触爬虫的时候,一个元素的定位能让我纠结半天。定位有很多种,我觉得最好用的是xpath,在这里分享一个用谷歌浏览器自动定位元素的trick,以后定位元素只需要复制就可以了。

第一步:找到在网页上定位元素

找到你需要定位的元素,右键-》检查,那么谷歌浏览器的有边框就会跳到相对应的元素位置。如图:

我右键点击了话题榜,然后代码就自动跳到了话题榜所在的元素。

第二步:复制xpath

在检查的代码里面点击你需要定位的元素,右键-》copy->xpath就可以了

这样子的话,你接下来在代码里面可以crtl+v复制一下,得到的就是这一个元素的xpath位置:

//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[2]/span

注意在使用的时候,xpath需要包含在单引号里面,不能是双引号。

ok,这个单个元素,那么问题来了,有时候我们需要某一类元素怎么办呢?

我们可以来观察一下这个微博界面:有话题榜,热搜榜,新时代。。。几个小标题,我们来看一看他们的xpath。

//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[1]/span
//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[2]/span
//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[3]/span
//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[4]/span

发现什么规律没有,对了,只有倒数第二个元素li元素的下标不太一样。那么如果你想获取所有的小标题,你把下标去掉就可以了。

//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li/span

以上。

谷歌浏览器获取网页元素的xpath相关推荐

  1. python获取网页元素坐标_html网页元素在屏幕上的坐标获取

    今天在用python调用IE获取html网页元素在屏幕上的坐标,当然为了截图啦,(*^__^*) 嘻嘻-- xtop=ie.document.forms[i].elements[j].getBound ...

  2. C# webbrowser 获取网页元素 示例代码

    在应用webbrowser对网页进行自动化操作时,不能有效地获取网页元素,往往是后续编程的拦路虎,原因是webbrowser提供的GetElementById().GetElementFromPoin ...

  3. 快速获取网页元素xpath的方法

    准备工具: chrome浏览器 步骤一:在chrome上打开自己想要获取元素的xpath的网页 例如,打开百度首页如下: 我的有点花哨,哈哈!!! 步骤二:按下F12,打开控制台 步骤三:选中自己想要 ...

  4. 快速获取网页元素xpath简单方法

    1.首先打开对应网页 2.点击F12 或者 Ctrl+Shift+i 或者点击浏览器右上角三个点.再点击 更多工具 ,再点击开发人员工具,如下图: 3.点击左上角的箭头,再在网页中点击需要查找的网页元 ...

  5. 【JavaScript】获取网页元素

    特殊元素: 分别获取body和html,全局仅有一个,比较特殊.格式固定,元素名可以自己另外起 var bodyElement=document.body var htmlElemnt=documen ...

  6. python使用requests+BeautifulSoup获取网页元素的内容

    1.导入第三方库request和beautifulsoup4 2.之后 import requests from bs4 import BeautifulSoup 3.使用requests中的get/ ...

  7. python获取网页元素坐标_Python实战爬虫系统学习笔记一:解析网页中的元素

    学习python编写爬虫第一天,学会如何解析本地网页 第1步:使用用Beautiful Soup解析网页 Soup = BeautifulSoup(wb_data,'lxml') 第2步:描述爬取信息 ...

  8. python 获取网页元素_记一次python提取网页标签元素的坑

    最新在学习Python抓取网页时,遇到一个坑,同一个方法提取两个网页,有一个网页提取不到正确的信息.先贴原始的代码 url = 'https://xxxx.com/' req = request.Re ...

  9. 获取网页元素的绝对位置

    首先看这张图片上的几个位置,content,就是你所定位元素的位置, 每个元素都有offsetTop和offsetLeft属性,表示该元素的左上角与父容器(offsetParent对象)左上角的距离. ...

  10. python自带网页解析器_Python爬虫Chrome网页解析工具-XPath Helper

    之前就说过Python爬虫中Xpath的用法,相信每一个写爬虫.或者是做网页分析的人,都会因为在定位.获取XPath路径上花费大量的时间,在没有这些辅助工具的日子里,我们只能通过搜索HTML源代码,定 ...

最新文章

  1. Linux学习笔记01
  2. 电脑无法检查计算机更新,安装win7系统弹出错误提示无法检查更新的方法
  3. 视频编解码(十六):VE解码器解码demo解码流程
  4. JUnit-三角形判断测试
  5. 谈谈计算机专业职业技能,计算机专业职业技能论文
  6. SQL语句执行优先级
  7. JLNews新闻点评系统--君兰IT
  8. 简易呼吸灯c语言程序,51单片机(呼吸灯)C语言版
  9. 微信 iOS 收款到帐语音提醒开发总结
  10. 联想拯救者y7000p加内存条_怎么给笔记本升级内存和硬盘 联想Y7000P加装内存和硬盘图文介绍...
  11. 行业寒冬下,简历发了几千次已读不回,功能测试的出路在哪里?
  12. 最通俗易懂---多分类学习之OvO、OvR、MvM
  13. java学习之SpringBoot2
  14. 数独小项目开篇:DFS解决数独难题
  15. 文件在EDIUS中打不开了怎么办
  16. 王兴的成功特质仅仅是爱思考吗?
  17. 教你用 HTML5 制作Flappy Bird(下)
  18. java项目 github_我们分析了30,000个GitHub项目-以下是Java,JS和Ruby排名前100的图书馆...
  19. 小米4C直接解锁、刷入TWRP、CM13和Gapps
  20. 【调剂】985大连理工大学软件学院2020年硕士研究生调剂缺额与报名通知

热门文章

  1. Mysql全国省区县地区码
  2. Elasticsearch常用搜索和分词器
  3. 用户生命周期,从运营到数据的最全攻略在这里
  4. html 默认ie设置,如何设置ie为默认浏览器,教您如何设置ie为默认浏览器
  5. 没有U盘纯硬盘安装linux之manjaro
  6. Android 取消壁纸,android – 壁纸设置强制关闭
  7. 华为华三学习工具模拟器安装教 程(ENSP与HCL)
  8. IOS-objectiveC【语法】修饰符 static extern const
  9. 屏蔽csdn右下角广告插件
  10. 符合 Qi 规范的移动设备无线充电解决方案