一 说明

Python语言的爬虫开发相对于其他编程语言是极其高校的,在上一篇文章 爬虫抓取博客园前10页标题带有Python关键字(不区分大小写) 的文章中,我们介绍了使用requests做爬虫开发,它能处理简单 的任务,也是入门爬虫最简单的方式。接下来我们将为大家介绍使用 beautiful soup 库 来做稍微复杂一点的任务。

二 实操

#!/usr/bin/env python3

# -*- coding: utf-8 -*-

# @Time : 2020/7/23 5:58 下午

# @Author : Albert Ma

# @File : test1.py

import requests

from bs4 import BeautifulSoup

##################

# 唐诗300首代码开始

##################

numbers = []

dynasties = []

poets = []

names = []

poems = []

for i in range(1, 17):

i = str(i)

url = 'http://www.shicimingju.com/shicimark/tangshisanbaishou_' + i + '_0__0.html'

r = requests.get(url)

demo = r.text # 服务器返回响应

soup = BeautifulSoup(demo, "html.parser")

"""

demo 表示被解析的html格式的内容

html.parser表示解析用的解析器

"""

html1 = soup.find_all(class_ = 'list_num_info')

for text in html1:

text = text.get_text().replace('

', '').replace(' ', '').replace('[', '|').replace(']', '|')

text = text.split('|')

numbers.append(text[0])

dynasties.append(text[1])

poets.append(text[2])

html2 = soup.find_all(class_ = 'shici_list_main')

for text in html2:

text = text.get_text().replace('

', '').replace(' ', '')

text = text.replace('展开全文', '').replace('收起', '').replace('《', '').replace('》', '|')

text = text.split('|')

names.append(text[0])

poems.append(text[1])

print(len(names), names)

print(len(poets), poets)

print(len(poems), poems)

print(len(numbers), numbers)

print(len(dynasties), dynasties)

##################

# 唐诗300首代码结束

##################

python唐诗分析综合_Python爬虫抓取唐诗宋词相关推荐

  1. python b站 排行_Python爬虫抓取B站小视频排行榜,新手也可以跟着做哦!

    Python爬虫学到什么程度就可以去找工作了? 有朋友在群里和大家讨论,问的最多的问题就是,python 爬虫学到什么程度可以去找工作了,关于这点,和大家分享下我的理解. 看大牛用Python实现发送 ...

  2. Python进阶之Scrapy-redis分布式爬虫抓取当当图书

    Python进阶之Scrapy-redis分布式爬虫抓取当当图书 1. 准备工作 1.1 安装scrapy-redis 1.2 在windows安装redis程序 1.3 打开redis服务 2. 需 ...

  3. python基金预测分析_Python爬虫抓取基金数据分析、预测系统设计与实现

    版权声明:本文为博主原创文章,如果转载请给出原文链接:http://doofuu.com/article/4156231.html 目前在开发一款基于Python的基金爬取.分析.预测系统,目前已经开 ...

  4. python爬虫资源大全_Python爬虫抓取纯静态网站及其资源(基础篇)

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:程序员宝库 **( 想要学习Python?Python ...

  5. python爬虫网易云音乐最热评论并分析_Python3实现爬虫抓取网易云音乐的热门评论分析(图)...

    这篇文章主要给大家介绍了关于Python3实战之爬虫抓取网易云音乐热评的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧. ...

  6. python爬取大众点评评论_python爬虫抓取数据 小试Python——爬虫抓取大众点评上的数据 - 电脑常识 - 服务器之家...

    python爬虫抓取数据 小试Python--爬虫抓取大众点评上的数据 发布时间:2017-04-07

  7. python爬虫app步骤_Python爬虫抓取手机APP的传输数据,python爬虫抓取app

    Python爬虫抓取手机APP的传输数据,python爬虫抓取app 大多数APP里面返回的是json格式数据,或者一堆加密过的数据 .这里以超级课程表APP为例,抓取超级课程表里用户发的话题. 1. ...

  8. python抓取数据库数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  9. python爬虫实现股票数据存储_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储!...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

最新文章

  1. 表中查询重复的数据,如何通过sql语句查询?
  2. 模板—主席树(待修改)
  3. 去除JSP页面中JSTL、EL生成的空行
  4. 树莓派安装vnc server并设置自启动
  5. linux 状态码的意义,HTTP状态码是什么?常见的状态码描述都有什么?
  6. [收藏学习]Linux的实时监测命令
  7. Kernel Crash kdump 使用指南
  8. 税控盘版增值税开票软件日志加密算法分析及解密工具
  9. 索尼( A7II)相机刷中文/汉化
  10. 【札记】二 先天八卦与后天八卦
  11. DPI与DFI技术分析
  12. Java笔记(错题)
  13. [NPUCTF2020]碰上彩虹,吃定彩虹
  14. 寄生电容和分布电容的区别
  15. skimage.io模块读取图片
  16. java linest_不要再纠结in和exists——JAVA伪代码直白分析二者时间复杂度
  17. 厦门考计算机竞赛保送北大清华名单,厦门这所学校130人获清华北大等名校保送资格...
  18. WordPress更新文章实时推送到百度
  19. 嵌入式设计---(1)嵌入式系统基础
  20. mplfinance绘制K线图

热门文章

  1. OJ每日一练——人口增长问题
  2. 学长冷月带你怒刷LeetCode之反转链表
  3. Abrash和TimSweeney两个文章
  4. 爬虫——记一次奇妙的异步请求爬取
  5. 个人总结对团队的贡献Android方面
  6. 全栈工程师开发实战之从入门到技术实战之02--vue指令
  7. python点云拼接
  8. 关于论坛、博客、SNS三者之间的区别
  9. matlab求两向量夹角_MATLAB教程-台大郭彦甫-第十二节,含练习答案
  10. 海思平台上USB WIFI的移植与局域网无线调试和视频流预览-第5/11季视频课程-朱有鹏-专题视频课程...