分析

找到文本的所处的div即可，注意应该是文本（一般是<span>text</span>这种形式）的上一级div,即div下面应该就是文本所在的span,找到文本所在的tag之后，使用.get_text()获取其文本信息。

代码

import requests
from bs4 import BeautifulSoup  # 获取html文档
def get_html(url):  """get the content of the url"""  response = requests.get(url)  response.encoding = 'utf-8'  #中文乱码的话，可以试一下gb2312return response.text  # 获取内容
def get_certain_web(html):  """get the content of the html"""  global soup  #方便调试soup = BeautifulSoup(html, 'lxml')  #使用lxml解析器对html进行解析，生成soup结构化文件web_content_temp = soup.select('div.index-tab-notice-right-list-title')#根据所需内容进行筛选web_content = ''for i in web_content_temp:web_content += i.get_text() + '\n'#web_content = soup.find('div',{'class':'zzj_5b_2d'})[0].get_text()    也可以使用这个return web_contenturl_web = "http://www.zzu.edu.cn/"
html = get_html(url_web)
web_content = get_certain_web(html)
print(web_content)

效果

python小小爬虫（一）—— 爬取学校官网通知（仅作为练习使用）相关推荐

Python 数据采集-爬取学校官网新闻标题与链接（基础）
Python 爬虫爬取学校官网新闻标题与链接一.前言二.扩展库简要介绍 01 urllib 库 (1)urllib.request.urlopen() 02 BeautifulSoup 库 (1) ...
Python 数据采集-爬取学校官网新闻标题与链接（进阶）
Python 爬虫爬取学校官网新闻标题与链接(进阶) 前言一.拼接路径二.存储三.读取翻页数据四.完整代码展示五.小结前言 ⭐ 本文基于学校的课程内容进行总结,所爬取的数据均为学习使用,请 ...
爬取学校官网信息公告并存入数据库
前段时间做了爬取学校信息并展示的小软件,爬取内容包括学校官网.教学管理系统.招生就业信息等,其中用到了QueryList库.翻页爬虫,定时爬虫,插入数据库等不熟系QueryList的可以看一下我的这 ...
python --爬虫爬取学校官网新闻并下载到本地
IDE:jupyter Notebook python version:python 3.6 目标数据:学校官网新闻(一页) 网址:* 使用到的库:requests urllib re Beautif ...
定时爬取学校官网讲座公告并邮件发给自己
文章目录前言流程各部分说明获取网页-Request库从HTML中提取数据-BeautifulSoup库 BeautifulSoup-转换成`BeautifulSoup` 的对象 find() ...
Python网络爬虫8 - 爬取彼岸图网美图
彼岸图网收集了大量美图,是个不错的爬取对象.话不多说,直接上图. 分析站点分类列表爬取之前,自然要分析一波,这个站点的框架比较简单,从分类着手,共包含12个分类项. 4K人物 4K动漫 4K动物 ...
【爬虫基础】爬取学校官网分页招聘信息
**爬取某学校就业网站招聘信息** 用到的包 from urllib.request import urlopen import requests import json 一.获取不同页面的url 在 ...
python——图片爬虫：爬取爱女神网站(www.znzhi.net)上的妹子图进阶篇
在上一篇博客中:python--图片爬虫:爬取爱女神网站(www.znzhi.net)上的妹子图基础篇我讲解了图片爬虫的基本步骤,并实现了爬虫代码在本篇中,我将带领大家对基础篇中的代码进行改善, ...
Python Scrapy爬虫框架爬取51job职位信息并保存至数据库
Python Scrapy爬虫框架爬取51job职位信息并保存至数据库 -------------------------------- 版权声明:本文为CSDN博主「杠精运动员」的原创文章,遵循CC ...

python小小爬虫（一）—— 爬取学校官网通知（仅作为练习使用）

文章目录

分析

代码

效果

python小小爬虫（一）—— 爬取学校官网通知（仅作为练习使用）相关推荐

最新文章

热门文章