任务描述

本关任务:改进上一关的代码。爬取湖南大学讲座网页的多个讲座信息,存储在二维列表jzxx中。 湖南大学讲座信息的网址为学术活动-湖南大学

相关知识

find_all函数 通过BeautifulSoup的find_all(name,attr)方法,可以找到符合条件的多个标签,将多个标签的内容返回为一个列表 lb=bg.find_all("div",class="xinwen-wen") 找到网页的所有class属性为xinwen-wen的div标签,存入列表lb

列表的操作 对于得到的多个标签的列表,使用for循环,可以依次访问每个标签,使用find函数找出其时间、标题和地点的文本,加入到列表,再加入二维列表jzxx中。

编程要求

根据提示,在右侧编辑器补充代码,爬取湖南大学讲座网页的多个讲座信息,存储在二维列表jzxx中。


开始你的任务吧,祝你成功!

import requests

from bs4 import BeautifulSoup

url = 'https://www.hnu.edu.cn/xysh/xshd.htm'

r = requests.get(url)

r.encoding = 'utf-8'

jzxx=[]

#代码开始

soup = BeautifulSoup(r.text, "html.parser")

lb = soup.find_all("div", class_="xinwen-wen")

for i in lb:

jzsj = i.find("div", class_= "xinwen-sj-top").text.strip()

jzbt = i.find("div", class_= "xinwen-wen-bt").text.strip()

jzdd = i.find("div", class_= "xinwen-wen-zy").text.strip()

jzxx.append([jzsj,jzbt,jzdd])

#代码结束

f1=open("jzxx2.txt","w")

for xx in jzxx:

f1.write(",".join(xx)+"\n")

f1.close()

第5关:爬取单页多个div标签的信息相关推荐

  1. 【爬虫】毕设学习记录:python爬取静态网页(只爬取单页)

    毕设题目是对指定网页内容进行正负向判断,并输出判断结果. 所以只需要爬取单页面的内容即可. 目标网页:在途网-哈尔滨酒店评价 [第一步:客户端向目标网址(服务器)发起get请求] import req ...

  2. python爬虫爬取多个页面_Python 爬虫爬取多页数据

    但是,按照常规的爬取方法是不可行的,因为数据是分页的: 最关键的是,不管是第几页,浏览器地址栏都是不变的,所以每次爬虫只能爬取第一页数据.为了获取新数据的信息,点击F12,查看页面源代码,可以发现数据 ...

  3. 爬虫实战:批量爬取京东内衣图片(自动爬取多页,非一页)

    做下男生想做的事,爬取大量妹子内衣图. 作者: 电气-余登武 准备工作 假如我们想把京东内衣类商品的图片全部下载到本地,通过手工复制粘贴将是一项非常庞大的工程,此时,可以用python爬虫实现. 第一 ...

  4. NO.1_python_scrapy组成爬取多页数据连接数据库配置文件书写

    scrapy框架组成及各部分作用 item pipelines: 用于存放需要存储数据的数据模型,一般格式为: #需要存储多少中类型的数据就写多少行,一般是key_value组合 '数据名称,即·ke ...

  5. 新浪微博粉丝爬虫-wap站只能爬取20页-

    由上图可见:微博已经视粉丝分布为商业机密,故爬取难度越来越大.无论web上爬,还是手机上爬,均受限. 两种方式:手动爬+微博API爬. 本文展示手动爬,以李易峰的粉丝分布为基础,只能爬取20页,源码如 ...

  6. 网易云爬虫-爬取单曲和歌单所有歌曲

    网易云爬虫-爬取单曲和歌单所有歌曲   今天断网了 敲代码不听歌的程序员是没有灵魂的,但是本地下载又太繁琐了,想着能不能一下把一个歌单的内容按文件夹进行下载,说做就做. 首先网上已经有了网易云js加载 ...

  7. python爬虫:爬取多页斗鱼颜值图片 并且下载到本地

    项目结构 main.py 运行scrapy from scrapy import cmdline cmdline.execute("scrapy crawl douyu_scrapy&quo ...

  8. 爬取虎扑网站上NBA球员数据信息

    爬虫案例的一般步骤 1.确定url地址(网页分析)爬虫程序就完成了一半 2.发送网络请求 requests(js\html\css) 3.数据解析(筛选数据) 4.保存数据(本地文件\数据库) 本次爬 ...

  9. 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息

    基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 注意:仅供学习交流,任何非法使用与作者无关! 目录 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 一.背景与取材 二. ...

最新文章

  1. Typescript 基本类型
  2. 趣链 BitXHub跨链平台 (6)IBC通信协议
  3. OC学习之面向对象三大特征
  4. 有关Vector里面元素重复解决办法
  5. 牛客多校6 - Harmony Pairs(数位dp)
  6. python网络攻击代码_Python-python网络编程写arp攻击代码
  7. Linux wc命令用于计算字数。
  8. iphone双卡_辟谣!iPhone12双卡模式下不支持5G?国行可正常使用
  9. 为什么需要 Redis 哨兵?
  10. 我对ThreadLocal的一些理解 内存泄露啥的
  11. 为什么实验是领英 DNA 的核心部分?
  12. Batch Normalization 算法解析
  13. 自绘LISTVIEW的滚动条(Delphi实现)
  14. 库卡机器人示教器截屏_KUKA库卡机器人示教器维修
  15. vue3+TDesign实现表格序号递增(t-table)
  16. 总结一下关于扫描电子显微镜与背散射电子探测器
  17. class6_os_demo2
  18. 服务器 系统做镜像,服务器系统做镜像
  19. 解决:id you register the component correctly? For recursive components, make sure to provide the “name
  20. 如何学习 JavaScript

热门文章

  1. idea启动TomCat失败,1099被占用,但是却找不到占用1099的进程解决方式。
  2. 深度学习第5周:运动鞋品牌识别
  3. android 自定义仿qq点赞动画
  4. 单视图测量 (2D变换、影消点线、单视图重构)
  5. 一个简单的微信跳一跳辅助工具(android)
  6. SecureCRT常用快捷键
  7. yum如何安装特定版本的gcc_yum安装gcc
  8. Windos(nginx集群搭建)
  9. mysql修改表字段长度sql,Java岗
  10. linux连接本机mysql数据库,Linux中MySQL连接本机数据库客户端