文章目录

  • 通过id,class选择元素
  • 元素内部筛选
  • 通过属性值筛选
  • 取值
  • 参考

通过id,class选择元素

#container 选择id为container的元素
.container 选择所有class包含container的元素
div:not(#content-container) 选取所有id为非content-container 的div

元素内部筛选

div a 选取所有div下所有a元素
ul + p 选取ul后面的第一个p元素
ul ~p 选取与ul相邻的所有p元素
dd:nth-child(7) 选择dd标签下的第7个子标签

通过属性值筛选

a[title] 选取所有拥有title属性的a元素
a[href=”csdn.net”] 选取所有href属性为csdn.net的a元素
a[href*=”.com”] 选取所有href属性值中包含.com的a元素
a[href^=”https://”] 选取所有href属性值中以https://开头的a元素

取值

div::text 选取div标签包住的值
a::attr(href) 选取a标签中的属性值

参考

w3cschool CSS 选择器参考手册:https://www.w3school.com.cn/cssref/css_selectors.asp

网络爬虫之css选择器相关推荐

  1. Python爬虫(5)css选择器

    css选择器 CSS 选择器用于"查找"(或选取)要设置样式的 HTML 元素. 顾名思义css选择器定位和选择的是HTML抽象DOM树上的一个或一类元素. 文章目录 css选择器 ...

  2. 【网络爬虫入门04】彻底掌握BeautifulSoup的CSS选择器

    [网络爬虫入门04]彻底掌握BeautifulSoup的CSS选择器 广东职业技术学院  欧浩源 2017-10-21 1.引言 目前,除了官方文档之外,市面上及网络详细介绍BeautifulSoup ...

  3. php 正则表达式获取html标签内容_总结Python网络爬虫四大选择器(正则表达式、BS4、Xpath、CSS)...

    今天来给大家总结一下这四个选择器,让大家更加深刻的理解和熟悉Python选择器. python高薪就业(视频.学习路线.免费获取)​shimo.im 一.正则表达式 正则表达式为我们提供了抓取数据的快 ...

  4. rvest | 网络爬虫初步——使用CSS选择器

    网络爬虫就是从网页上批量提取相应的信息,主要原理就是利用一定的 规则进行信息定位.tidyverse系列工具包中的rvest工具包可以快捷实现这一功能.下面代码就是使用rvest中的相关函数进行爬虫的 ...

  5. 网络爬虫CSS选择器详细讲解

    网络爬虫CSS选择器详细讲解 前言 使用步骤 1.解析的HTML代码 2.逐层选择节点 3.获取文本(string和get_text()) 4.获取节点的属性值 5.选择单个和多个节点 6.通过cla ...

  6. python爬虫哪个选择器好用_Python网络爬虫四大选择器用法原理总结

    前几天小编连续写了四篇关于Python选择器的文章,分别用正则表达式.BeautifulSoup.Xpath.CSS选择器分别抓取京东网的商品信息.今天小编来给大家总结一下这四个选择器,让大家更加深刻 ...

  7. 零基础学Python-爬虫-3、利用CSS选择器爬取整篇网络小说

    本套课程正式进入Python爬虫阶段,具体章节根据实际发布决定,可点击[python爬虫]分类专栏进行倒序观看: [重点提示:请勿爬取有害他人或国家利益的内容,此课程虽可爬取互联网任意内容,但无任何收 ...

  8. 【Python爬虫】用CSS 选择器提取网页数据

    使用 pip 安装 requests_html 库 pip install requests_html 根据你的网络情况,通常需要几分钟时间. 在你的电脑任意位置,新建一个 crawler.py 文件 ...

  9. HTML5+CSS3-边框背景图、多背景图、CSS选择器、网络字体、边框背景图片、过渡、放大、旋转

    边框背景图片 1.  background-origin:设置背景图片的起始原点 background-origin:border-box;------背景图片从边框开始显示 background-o ...

最新文章

  1. python 还原九宫格图片_用Python做一个好玩的朋友圈九宫格抽奖
  2. Data Storage(数据存储)之内部储存(Internal Storage)
  3. 用JavaScript实现100以内自然数求和
  4. html5自动把某个层放在屏幕底部,告诉你一个将 footer 保持在底部的最好方法
  5. python命令行模式怎么输入_python获得命令行输入的参数的两种方式
  6. 查看php项目tp版本,tp5.1如何查看版本号
  7. 使用PING判断TCP/IP故障
  8. SpringBoot2.x集成Apache Shiro并完成简单的Case开发
  9. win10笔记本已连接充电器却不显示连接怎么解决?
  10. 获取图像像素点的概率分布图
  11. windows7系统怎么内录
  12. linux程序性能分析工具stap,《面向应用开发者的系统指南》CPU篇之使用systemtap分析进程的行为...
  13. 中国银行C语言笔试题,中国银行软件中心2016校园招聘笔试题经验
  14. android studio 初始化项目加载时间过长或失败问题解决
  15. sklearn预测员工离职率
  16. 潘金莲——中国女性解放思想的先驱《其实我的心没走》
  17. 教你快速爬取哔哩哔哩整部番剧的视频弹幕
  18. 数字图像处理实验八图像的傅里叶变换
  19. the daily 发布了
  20. Velodyne 32E pcap包GPS时间戳解析

热门文章

  1. c++ 结构体初始化_单片机C语言 - 基于结构体的面向对象编程技巧
  2. java access 不在本地_线上的java项目访问不到线上数据库,但是这个数据库我本地可以连接到,求解...
  3. Graphics Driver 的编写
  4. 快速上手Google C++ 测试框架googletest
  5. Specified key was too long; max key length is 767 bytes
  6. js字符串解析与转换成数字
  7. Java程序员学习笔记——Mybatis日常记录
  8. 连载17:软件体系设计新方向:数学抽象、设计模式、系统架构与方案设计(简化版)(袁晓河著)...
  9. 处理UnicodeDecodeError: ‘XXX' codec can't decode bytes in position...的问题
  10. 【在线研讨】《敏捷开发用户故事分类与组织结构(三期-1)》