到目前为止,我们已经介绍过如何获取和过滤标签,以及获取标签里的内容。但是,在网

络数据采集时你经常不需要查找标签的内容,而是需要查找标签属性。比如标签<a> 指向

的URL 链接包含在href 属性中,或者<img> 标签的图片文件包含在src 属性中,这时获

取标签属性就变得非常有用了。

对于一个标签对象,可以用下面的代码获取它的全部属性:

myTag.attrs

要注意这行代码返回的是一个Python 字典对象,可以获取和操作这些属性。比如要获取图

片的资源位置src,可以用下面这行代码:

myImgTag.attrs["src"]

 

转载于:https://www.cnblogs.com/yintingting/p/6576597.html

python学习之----获取标签属性相关推荐

  1. xpath获取标签属性值

    html <a href='www.some.com'><span>hello </span>world</a> #获取a标签下的文本 xpath(&q ...

  2. python获取标签属性值_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释

    更多python教程请到: 菜鸟教程www.piaodoo.com 人人影视www.sfkyty.com 16影视www.591319.com 星辰影院www.591319.com 一.Tag(标签) ...

  3. dom4j解析xml格式字符串获取标签属性和内容

    /*** 解析xml字符串,获取各项属性内容* readXML方法描述:* * @author : gc* @createTime : 2019-4-26 下午4:37:50*/private sta ...

  4. Python学习:获取文件夹中最新的文件/文件夹

    文章概述 获取最新修改文件 关于lambda的用法 os.path.getmtime用法 获取最新修改文件 获取文件夹中,最新修改过的文件或者文件夹 import os # 文件夹目录 path=&q ...

  5. BeautifulSoup查找、选择、删除标签,获取标签属性、文本等

    new一个对象 from bs4 import BeautifulSoup soup = BeautifulSoup(html, features="html.parser") 1 ...

  6. jQuery获取标签属性值(一)

    1.box-shadow属性可以设置盒子阴影的效果其参数为: box-shadow: h-shadow v-shadow blur spread color inset; h-shadow 必需的.水 ...

  7. php xml获取标签属性,php获取xml属性值

    php获取xml属性值 $dom = new DOMDocument(); if (!$dom->load('attr.xml')) { echo "load books.xml fa ...

  8. Python学习10 内置属性 对象属性 类属性 私有属性 私有方法 对象方法 类方法 静态方法

    内置属性 创建类时系统自动创建的属性 # 内置属性:dir(对象),列出所有的内置属性 class Person(object):'''Person类1'''# Person类2__slots__ = ...

  9. selenium如何获取标签属性

    在用selenium时,发现用@href拿不到标签的属性,但是去掉@href时不报错,发现不是代码的问题,才发现原来selenium有专门的获取方式 这是我第一次的代码(至于为什么这么写,是因为req ...

最新文章

  1. Mobileye_EyeQ4功能和性能
  2. HDU4008 Parent and son [树形DP]
  3. nodejs之connect
  4. CoCos2D-X-2.1.5在Eclipse中导入HelloCpp项目搭建
  5. 树莓派:挂载网络存储网络硬盘
  6. IMPORTANT: BizTalk Server 2004 fixes for Windows XP SP2 and .NET FW 1.1 SP1
  7. 用户态文件系统fuse学习
  8. 使用CAD手机看图软件打开图纸压缩包的方法技巧
  9. 很少人知道的无人机飞行原理
  10. RPA手把手—— RPA 数据库篇 6 - MySQL 篇 2 - 增删改查 1
  11. codeforces 158B
  12. JavaScript数组every方法
  13. 高精度反正切函数的实现
  14. Spring Boot项目自定义启动Banner
  15. 为什么目前的串行比并行传输快
  16. 二叉排序树(二叉搜索树)
  17. web前端面试宝典——带你直击面试重难点(40个经典题目,涵盖近90%的考点,码字2w,干货满满!)
  18. C++基础入门(超详细)
  19. BHQ-2胺是一种暗猝灭剂,BHQ-2 amine,1241962-11-7可与目标底物或含有羧酸盐部分的生物分子结合
  20. 固定资产系统管理软件最新完整版,固定资产管理系统免费版

热门文章

  1. .net 文件类型 及说明
  2. IIS 下配置无后缀的URL ReWrite
  3. page event
  4. Glide-源码分析(一)
  5. 想客户之所想 华为全栈云加速行业云化创新
  6. C# MBG 扩展方法类库 分享
  7. SQL SERVER 2012 修改数据库默认位置不立即生效
  8. Spark 1.0.0版本发布
  9. Cmake的install与file命令的区别
  10. 汇编学习心得(二)关于字符的处理