python BeautifulSoup对应关系
2019独角兽企业重金招聘Python工程师标准>>>
#!/usr/bin/python3
# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
#参考https://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html#findAllNext%28name,%20attrs,%20text,%20limit,%20**kwargs%29%20and%20findNext%28name,%20attrs,%20text,%20**kwargs%29
def helloworld():
print("hello world")
pass
if __name__ == '__main__':
xml = """<root>
<book class="bookname" herf="http://www.baidu.com">helloPython</book>
<book class="user">shz</book>
<a herf="http://www.baidu.com"/>
</root>"""
bf= BeautifulSoup(xml,"lxml")
print("==========================")
tag = bf.find(class_ = "bookname") #类型是tag
print("test: " + str(tag)) # <book class="bookname" herf="http://www.baidu.com">helloPython</book>
print("name: " + tag.name) # book
print("text: " + tag.text) # helloPython
print("attrs: " + str(tag.attrs))
print("attr:herf: " + str(tag["herf"]))
print("attr:class: " + str(tag["class"]))
print("==========================")
print("多个 返回list")
print("==========================")
tags= bf.findAll(name="book") #类型是tag
print("test: " + str(tags))
print("name: " + tags[1].name)
print("==========================")
print("多个 返回list")
print("==========================")
tags= bf.findAll(name="a") #类型是tag
print("test: " + str(tags))
print("name: " + tags[0].name)
print("herf: " + tags[0]["herf"])
pass
以上是测试代码
======================================================================
下面是输出结果
==========================
test: <book class="bookname" herf="http://www.baidu.com">helloPython</book>
name: book
text: helloPython
attrs: {'herf': 'http://www.baidu.com', 'class': ['bookname']}
attr:herf: http://www.baidu.com
attr:class: ['bookname']
==========================
多个 返回list
==========================
test: [<book class="bookname" herf="http://www.baidu.com">helloPython</book>, <book class="user">shz</book>]
name: book
==========================
多个 返回list
==========================
test: [<a herf="http://www.baidu.com"></a>]
name: a
herf: http://www.baidu.com
转载于:https://my.oschina.net/u/4000302/blog/2967385
python BeautifulSoup对应关系相关推荐
- 如何确定python对应电脑版本_查看Anaconda版本、Anaconda和python版本对应关系和快速下载...
官网 查看Anaconda版本 (C:\ProgramData\Anaconda3) C:\Users\Administrator>conda -V conda 4.3.30 Anaconda和 ...
- python beautifulsoup抓取网页内容_利用Python和Beautiful Soup抓取网页内容
利用Python和Beautiful Soup抓取网页内容 Posted on 2012-08-09 00:08 SamWei 阅读(381) 评论(1) 编辑 收藏 Python 3中提供了url打 ...
- Python beautifulsoup爬取小说
Python beautifulsoup爬取小说 提前准备好需要的库文件,命令行输入以下命令 pip install requests pip install bs4 pip install lxml ...
- Python+beautifulsoup+requests 爬取网易新闻评论
前段时间在看处理数据相关的书籍,实践中需要一些网上评论的文本数据集,所以想到爬取网易新闻底下的评论.本来想着Python+beautifulsoup(解析)+requests(抓取),最后存储在txt ...
- anaconda 和python 版本对应关系
一.安装anaconda并不知道会包含哪个版本的python问题 本文的初衷是因为安装anaconda的时候你并不知道会包含哪个版本的python,因此我制作了下表 如果你使用的主要的python版本 ...
- Python+BeautifulSoup+Selenium模拟浏览器循环自动播放视频,如哔哩哔哩某个UP主的视频
1.前言 计算机的出现,推动了人类社会的进步,使得人们更高效的工作或是生活.当我们很"懒"的时候,计算机就能站出来,帮助我们做一些我们觉得浪费时间的事情了.你嫌用手点鼠标麻烦,计算 ...
- anaconda老版本下载的方法和Anaconda与Python版本对应关系以及anaconda安装方法
官网是最新版本的anaconda,我的python是3.7的.就要找3.7的版本. 所有版本在这个网站都可以下载(清华大学开源软件镜像站): https://mirrors.tuna.tsinghua ...
- python BeautifulSoup的简单使用
官网:https://www.crummy.com/software/BeautifulSoup/bs4/doc/ 参考:https://www.cnblogs.com/yupeng/p/336203 ...
- python+BeautifulSoup+多进程爬取糗事百科图片
用到的库: import requests import os from bs4 import BeautifulSoup import time from multiprocessing impor ...
- python:beautifulSoup学习(来自学习资料)
罗列问题: 1.beautifulSoup是什么 是一个能够快速从html或者xml文档中获取数据的类库. 官方的说是,能够帮你节省一天或者几天的开发时间. 2.beautifulSoup如何安装 P ...
最新文章
- 端到端伪激光图像3D目标检测
- poj3122(二分算法)
- [Winform]检测exe是否已经运行,并将其置顶
- OpenCV与c语言图像融合
- 练习4.4、4.5、4.6、4.7
- 阿里云高级技术专家白常明谈《边缘云的技术挑战和应用创新》
- C++ Primer 7.33 练习编写成员函数
- 模式匹配运算符–Shell
- Android系统性能优化(68)---绘制优化
- 1-概述程序构成基本元素
- 华为鸿蒙乌鸦快爷,华为鸿蒙第一批名单
- (转载)找工作那年,我真的哭了
- 160个破解练习之CrackMe 006
- 深度 linux 打印机,阻挡Deepin成为主力系统的障碍就是对打印机的支持
- 结构化分析与设计方法
- python 取余 韩信点兵_韩信点兵问题的神算法
- 【EndNote文献管理】批量导入删除引用
- WIN10 困扰多时的屏幕亮度 终于可以调节了-完美 -更新2018年2月28日
- 【大战函数——把函数彻底吃透】
- AXI3和AXI4的接口信号区别
热门文章
- Android——列表选择框(Spinner)
- Cocos2d-x Auto-batching 浅浅的”深入分析”
- VS编译时自动引用Debug|Release版本的dll
- Linux设备驱动(转)
- 8.最大滑动窗口问题
- nginx 502 .sock failed (11: Resource temporarily unavailable) while connecting to upstream
- 关于 SQLNET.AUTHENTICATION_SERVICES 验证方式的说明
- TDirectory.IsRelativePath是否相对路径
- XHTML 教程 续二
- 程序员揭秘 一些鲜为人知的编程真相