requests

requests库可以看看这篇文章
http://blog.csdn.net/shanzhizi/article/details/50903748
最近在学习嵩天老师的Python网络爬虫课程,记录一下.

bs4

1.Beautiful Soup库,也叫beautifulsoup4 或bs4
约定引用方式如下,即主要是用BeautifulSoup类

from bs4 import BeautifulSoup
import bs4

2.BeautifulSoup库解析器

3.BeautifulSoup类的基本元素

4.测试代码(太乱了)

import requests
from bs4 import BeautifulSoupr = requests.get('http://python123.io/ws/demo.html',timeout = 30)
r.raise_for_status()
r.encoding = r.apparent_encoding
# print(r.text)
demo = r.text
soup = BeautifulSoup(demo,"html.parser")
print(soup.title)
tag = soup.a
print(tag)
print(soup.a.parent.name) #通过name获得标签的名字
print(soup.a.parent.parent.name)
print(tag.attrs) #标签的属性,以字典形式打印,href class id
print(tag.attrs['class'])
print(tag.attrs['href'])
print(type(tag))  # a标签的类型 bs4中认可的属性
print(tag.string)
print(soup.p.string)
print(type(soup.p.string))  #bs4.element.NavigableString类型,p标签之间的内容的类型

Python网络爬虫--BeautifulSoup库的基本元素相关推荐

  1. python网络爬虫--BeautifulSoup

    本随笔记录学习崔庆才老师编著的<Python3网络爬虫开发实战>以及<Beautiful Soup 4.4.0文档>. 安装BeautifulSoup4以及解析器 Instal ...

  2. python网络爬虫第三方库_Python常用第三方库大盘点

    Python语言有超过12万个第三方库,覆盖信息技术几乎所有领域.下面简单介绍下网络爬虫.自动化.数据分析与可视化.WEB开发.机器学习和其他常用的一些第三方库,如果有你感兴趣的库,不妨去试试它的功能 ...

  3. python网络爬虫工具库集合

    经常逛 GitHub 的同学可能会听说过大名鼎鼎的 awesome 仓库,没错,就是这个:https://github.com/sindresorhus/awesome. 这个库可谓是一个极大的宝藏, ...

  4. python网络爬虫系列教程——python中pyquery库应用全解

    全栈工程师开发手册 (作者:栾鹏) python教程全解 python网络爬虫lxml库的应用全解. 在线安装方法:cmd中输入"pip install pyquery" 离线安装 ...

  5. python网络爬虫系列教程——python中lxml库应用全解(xpath表达式)

    全栈工程师开发手册 (作者:栾鹏) python教程全解 python网络爬虫lxml库的应用全解. 在线安装方法:cmd中输入"pip install lxml" 离线安装,下载 ...

  6. Python网络爬虫简介与环境配置

    第一章 Python网络爬虫简介与环境配置 1.1 网络爬虫简介 随着互联网的快速发展越来越多的信息被发布到互联网上,这些信息被嵌入到各种各样的网页结构及样式中.虽然搜索引擎可以辅助用户搜索这些网页信 ...

  7. 爬虫书籍-Python网络爬虫权威指南OCR库 NLTK 数据清洗 BeautifulSoup Lambda表达式 Scrapy 马尔可夫模型

    Python网络爬虫权威指南 编辑推荐 适读人群 :需要抓取Web 数据的相关软件开发人员和研究人员 作为一种采集和理解网络上海量信息的方式,网页抓取技术变得越来越重要.而编写简单的自动化程序(网络爬 ...

  8. Python 网络爬虫笔记3 -- Beautiful Soup库

    Python 网络爬虫笔记3 – Beautiful Soup库 Python 网络爬虫系列笔记是笔者在学习嵩天老师的<Python网络爬虫与信息提取>课程及笔者实践网络爬虫的笔记. 课程 ...

  9. Python 网络爬虫笔记5 -- Beautiful Soup库实战

    Python 网络爬虫笔记5 – Beautiful Soup库实战 Python 网络爬虫系列笔记是笔者在学习嵩天老师的<Python网络爬虫与信息提取>课程及笔者实践网络爬虫的笔记. ...

最新文章

  1. AMAB interconnector PL301(二)
  2. 一个用户实体应该有它自己的实体验证,即一个实体应该有它的属性,方法,扩展属性及验证机制组成...
  3. VLC搭建RTSP服务器的过程 -测试通过
  4. Android 学习笔记之Volley开源框架解析(一)
  5. shellcode学习总结
  6. mysql与oracle性能对比,Oracle与MySQl对比,
  7. 怎么拿img标签的data_PASCAL VOC数据集-分割标签索引颜色对照及程序
  8. 条码软件调用ERP系统
  9. 【qduoj】C语言课程设计_约瑟夫问题
  10. Java Web:session
  11. XML指南——XML元素
  12. python测试开发django-46.xadmin添加action动作
  13. 简短的计算机病毒,最简单的电脑病毒
  14. 中国统计年鉴2021(各省份经济指标,人口规模,工农业数据,主要社会经济指标)
  15. SAAS-HRM-day4
  16. 分析方法选讲期末复习脉络图---完结版
  17. matlab 温度计,Matlab与Excel相结合实现标准铂电阻温度计检定数据处理
  18. 莱西姆大学计算机专业,菲律宾的大学排名是根据什么指标排的
  19. APICloud的特性
  20. 新浪微博开放平台站内应用开发流程直播(二)

热门文章

  1. 中的 隐藏鼠标菜单_如何在鼠标右键菜单中添加自定义菜单?工效率提升一倍...
  2. python读取二进制数据中的while循环_在Python中读取二进制文件并循环遍历每个字节...
  3. 图像分割之(三)从Graph Cut到Grab Cut
  4. 初学Java Web(1)——Web概述
  5. Dubbo的使用及原理浅析
  6. MyBatis动态SQL底层原理分析
  7. Python 异常处理 Python 基础教程 try..except
  8. 中国计算机学会CCF推荐国际学术会议和期刊目录-计算机科学理论
  9. 图像处理(二)Seam Carving算法-Siggraph 2007
  10. 【caffe】windows下vs2013+opencv3.2.0+opencv_contrib(包含dnn)+cmake3.8编译与配置