2019独角兽企业重金招聘Python工程师标准>>>

#!/usr/bin/python3
# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup

#参考https://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html#findAllNext%28name,%20attrs,%20text,%20limit,%20**kwargs%29%20and%20findNext%28name,%20attrs,%20text,%20**kwargs%29

def helloworld():
    print("hello world")
    pass

if __name__ == '__main__':

xml = """<root>
        <book class="bookname" herf="http://www.baidu.com">helloPython</book>
        <book class="user">shz</book>
        <a herf="http://www.baidu.com"/>
        </root>"""
    bf= BeautifulSoup(xml,"lxml")
    print("==========================")
    tag = bf.find(class_ = "bookname") #类型是tag
    print("test: " + str(tag))  # <book class="bookname" herf="http://www.baidu.com">helloPython</book>
    print("name: " + tag.name)  # book
    print("text: " + tag.text)  # helloPython
    print("attrs: "  + str(tag.attrs))
    print("attr:herf: "  + str(tag["herf"]))
    print("attr:class: "  + str(tag["class"]))
    print("==========================")
    print("多个 返回list")
    print("==========================")
    tags= bf.findAll(name="book") #类型是tag
    print("test: " + str(tags))
    print("name: " + tags[1].name)
    print("==========================")
    print("多个 返回list")
    print("==========================")
    tags= bf.findAll(name="a") #类型是tag
    print("test: " + str(tags))
    print("name: " + tags[0].name)
    print("herf: " + tags[0]["herf"])
    pass

以上是测试代码

======================================================================

下面是输出结果

==========================
test: <book class="bookname" herf="http://www.baidu.com">helloPython</book>
name: book
text: helloPython
attrs: {'herf': 'http://www.baidu.com', 'class': ['bookname']}
attr:herf: http://www.baidu.com
attr:class: ['bookname']
==========================
多个 返回list
==========================
test: [<book class="bookname" herf="http://www.baidu.com">helloPython</book>, <book class="user">shz</book>]
name: book
==========================
多个 返回list
==========================
test: [<a herf="http://www.baidu.com"></a>]
name: a
herf: http://www.baidu.com

转载于:https://my.oschina.net/u/4000302/blog/2967385

python BeautifulSoup对应关系相关推荐

  1. 如何确定python对应电脑版本_查看Anaconda版本、Anaconda和python版本对应关系和快速下载...

    官网 查看Anaconda版本 (C:\ProgramData\Anaconda3) C:\Users\Administrator>conda -V conda 4.3.30 Anaconda和 ...

  2. python beautifulsoup抓取网页内容_利用Python和Beautiful Soup抓取网页内容

    利用Python和Beautiful Soup抓取网页内容 Posted on 2012-08-09 00:08 SamWei 阅读(381) 评论(1) 编辑 收藏 Python 3中提供了url打 ...

  3. Python beautifulsoup爬取小说

    Python beautifulsoup爬取小说 提前准备好需要的库文件,命令行输入以下命令 pip install requests pip install bs4 pip install lxml ...

  4. Python+beautifulsoup+requests 爬取网易新闻评论

    前段时间在看处理数据相关的书籍,实践中需要一些网上评论的文本数据集,所以想到爬取网易新闻底下的评论.本来想着Python+beautifulsoup(解析)+requests(抓取),最后存储在txt ...

  5. anaconda 和python 版本对应关系

    一.安装anaconda并不知道会包含哪个版本的python问题 本文的初衷是因为安装anaconda的时候你并不知道会包含哪个版本的python,因此我制作了下表 如果你使用的主要的python版本 ...

  6. Python+BeautifulSoup+Selenium模拟浏览器循环自动播放视频,如哔哩哔哩某个UP主的视频

    1.前言 计算机的出现,推动了人类社会的进步,使得人们更高效的工作或是生活.当我们很"懒"的时候,计算机就能站出来,帮助我们做一些我们觉得浪费时间的事情了.你嫌用手点鼠标麻烦,计算 ...

  7. anaconda老版本下载的方法和Anaconda与Python版本对应关系以及anaconda安装方法

    官网是最新版本的anaconda,我的python是3.7的.就要找3.7的版本. 所有版本在这个网站都可以下载(清华大学开源软件镜像站): https://mirrors.tuna.tsinghua ...

  8. python BeautifulSoup的简单使用

    官网:https://www.crummy.com/software/BeautifulSoup/bs4/doc/ 参考:https://www.cnblogs.com/yupeng/p/336203 ...

  9. python+BeautifulSoup+多进程爬取糗事百科图片

    用到的库: import requests import os from bs4 import BeautifulSoup import time from multiprocessing impor ...

  10. python:beautifulSoup学习(来自学习资料)

    罗列问题: 1.beautifulSoup是什么 是一个能够快速从html或者xml文档中获取数据的类库. 官方的说是,能够帮你节省一天或者几天的开发时间. 2.beautifulSoup如何安装 P ...

最新文章

  1. 端到端伪激光图像3D目标检测
  2. poj3122(二分算法)
  3. [Winform]检测exe是否已经运行,并将其置顶
  4. OpenCV与c语言图像融合
  5. 练习4.4、4.5、4.6、4.7
  6. 阿里云高级技术专家白常明谈《边缘云的技术挑战和应用创新》
  7. C++ Primer 7.33 练习编写成员函数
  8. 模式匹配运算符–Shell
  9. Android系统性能优化(68)---绘制优化
  10. 1-概述程序构成基本元素
  11. 华为鸿蒙乌鸦快爷,华为鸿蒙第一批名单
  12. (转载)找工作那年,我真的哭了
  13. 160个破解练习之CrackMe 006
  14. 深度 linux 打印机,阻挡Deepin成为主力系统的障碍就是对打印机的支持
  15. 结构化分析与设计方法
  16. python 取余 韩信点兵_韩信点兵问题的神算法
  17. 【EndNote文献管理】批量导入删除引用
  18. WIN10 困扰多时的屏幕亮度 终于可以调节了-完美 -更新2018年2月28日
  19. 【大战函数——把函数彻底吃透】
  20. AXI3和AXI4的接口信号区别

热门文章

  1. Android——列表选择框(Spinner)
  2. Cocos2d-x Auto-batching 浅浅的”深入分析”
  3. VS编译时自动引用Debug|Release版本的dll
  4. Linux设备驱动(转)
  5. 8.最大滑动窗口问题
  6. nginx 502 .sock failed (11: Resource temporarily unavailable) while connecting to upstream
  7. 关于 SQLNET.AUTHENTICATION_SERVICES 验证方式的说明
  8. TDirectory.IsRelativePath是否相对路径
  9. XHTML 教程 续二
  10. 程序员揭秘 一些鲜为人知的编程真相