# 获取a标签

title_elements = await page.Jx('//*[@class="result c-container "]/h3/a')

for item in title_elements:

# 获取文本:方法一,通过getProperty方法获取

title_str1 = await (await item.getProperty('textContent')).jsonValue()

print(title_str1)

# 获取文本:方法二,通过evaluate方法获取

title_str2 = await page.evaluate('item => item.textContent', item)

print(title_str2)

# 获取链接:通过getProperty方法获取

title_link = await (await item.getProperty('href')).jsonValue()

print(title_link)

python爬虫提取a标签_Python爬虫 Pyppeteer获取a标签的文本和链接相关推荐

  1. python爬虫提取a标签_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释

    一.Tag(标签)对象 1.Tag对象与XML或HTML原生文档中的tag相同. from bs4 import BeautifulSoup soup = BeautifulSoup('Extreme ...

  2. python代码html显示数据_Python爬虫基础之认识html和学习数据提取(上)

    我:我已经学会了基本的python,接下来可以学什么鸭? 惨绿青年:接下来可以学习制作python爬虫了,但还是需要学习相关的知识. 我:什么知识鸭? 惨绿青年:网页的相关知识.我们看到的网页一般是h ...

  3. python win32ui选取文件夹_Python爬虫基础之认识html和学习数据提取(上)

    我:我已经学会了基本的python,接下来可以学什么鸭? 惨绿青年:接下来可以学习制作python爬虫了,但还是需要学习相关的知识. 我:什么知识鸭? 惨绿青年:网页的相关知识.我们看到的网页一般是h ...

  4. Python正则匹配HTML,python正则匹配html标签_Python爬虫常用正则表达式及HTML网页标签分析总结...

    这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法.它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~ 当然如果会Selenium基于自动化测试爬 ...

  5. python正则匹配html标签_Python爬虫常用正则表达式及HTML网页标签分析总结

    这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法.它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~ 当然如果会Selenium基于自动化测试爬 ...

  6. python xpath定位 嵌套标签_python爬虫中使用Xpath方法定位a标签中所有的子标签的方法...

    老板扔给了我一个陈年语料,让我通过文章标题回原网址爬取一下对应的doi号,文章很好定位,但是在解析标题的时候遇到了问题,a标签中混合了i.sub.sup标签,在使用xpath时不能直接使用text方法 ...

  7. python爬虫企业级技术点_Python爬虫必备技术点(一)

    爬虫必备技术 面向具有Python基础的Python爬虫爱好者,urllib和requests两个库在实际的项目中应用也非常广泛,不仅用于爬虫技术也可以应用在API接口调用方面.如果需要相关的案例可以 ...

  8. python的xpath用法介绍_python爬虫之xpath的基本使用详解

    本篇文章主要介绍了python爬虫之xpath的基本使用详解,现在分享给大家,也给大家做个参考.一起过来看看吧 一.简介 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XM ...

  9. python爬取网页停止_Python爬虫之爬取静态网页

    所谓网络爬虫,通俗的讲,就是通过向我们需要的URL发出http请求,获取该URL对应的http报文主体内容,之后提取该报文主体中我们所需要的信息.所以,想要学习python爬虫,需要具备一些http的 ...

最新文章

  1. Thread系列——Thread.Sleep(0)
  2. unordered_map 碰撞处理 重哈希
  3. C++中的sta::atomic<bool>和auto类型
  4. SpringBoot之日志
  5. Swift 协议protocol
  6. html如何改变浏览器的图标,css 更换浏览器 默认图标
  7. 2017微服务 mysql集群_成功升P7多亏掌握了这几点:高并发+Nginx+微服务+Redis+MySQL...
  8. mysql xa 演示_mysql的XA事务恢复过程详解
  9. LaTeX双栏模板插入通栏公式(跨栏插图)
  10. linux下oracle10g安装配置说明,Linux下oracle10g安装配置说明(ZT)
  11. php代码怎么看错在哪里,PHP代码不知道哪里错了。
  12. VS2010 小技巧
  13. 磁盘大小限制_Linux服务器磁盘爆满查询之百度云服务器
  14. 【原创】ASP.NET C# 对SQL/ACCESS 数据库的备份和还原函数
  15. 后端小白的VUE入门笔记, 前端高能慎入
  16. Movie Studio插入的素材支持什么格式?
  17. BAT中for循环处理某目录下的文件
  18. torch.optim优化算法理解之optim.Adam()
  19. Android:音乐播放器(3)—从播放列表到播放歌曲
  20. DIY信号发生器:运放实现三角波、方波发生器(详细参数说明)+multisim仿真

热门文章

  1. Python 学习笔记(半ZZ半自己写)
  2. C语言实现的一个简单的HTTP程序
  3. 笔记1——C++多态与Java多态的异同
  4. pythongoogle.probuf.timestamp_数据通信格式:Google Protobuf
  5. Webpack入门教程三
  6. 接口请求时params与data的区别
  7. 瞬间几千次的重复提交,我用 Spring Boot + Redis 扛住了!
  8. 面试必问!有没有比读写锁更快的锁?
  9. Spring Boot 配置文件 yml与properties
  10. 12 岁开始学编程,17 岁总结了 7 个重要教训!