python唐诗分析综合_Python爬虫抓取唐诗宋词
一 说明
Python语言的爬虫开发相对于其他编程语言是极其高校的,在上一篇文章 爬虫抓取博客园前10页标题带有Python关键字(不区分大小写) 的文章中,我们介绍了使用requests做爬虫开发,它能处理简单 的任务,也是入门爬虫最简单的方式。接下来我们将为大家介绍使用 beautiful soup 库 来做稍微复杂一点的任务。
二 实操
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# @Time : 2020/7/23 5:58 下午
# @Author : Albert Ma
# @File : test1.py
import requests
from bs4 import BeautifulSoup
##################
# 唐诗300首代码开始
##################
numbers = []
dynasties = []
poets = []
names = []
poems = []
for i in range(1, 17):
i = str(i)
url = 'http://www.shicimingju.com/shicimark/tangshisanbaishou_' + i + '_0__0.html'
r = requests.get(url)
demo = r.text # 服务器返回响应
soup = BeautifulSoup(demo, "html.parser")
"""
demo 表示被解析的html格式的内容
html.parser表示解析用的解析器
"""
html1 = soup.find_all(class_ = 'list_num_info')
for text in html1:
text = text.get_text().replace('
', '').replace(' ', '').replace('[', '|').replace(']', '|')
text = text.split('|')
numbers.append(text[0])
dynasties.append(text[1])
poets.append(text[2])
html2 = soup.find_all(class_ = 'shici_list_main')
for text in html2:
text = text.get_text().replace('
', '').replace(' ', '')
text = text.replace('展开全文', '').replace('收起', '').replace('《', '').replace('》', '|')
text = text.split('|')
names.append(text[0])
poems.append(text[1])
print(len(names), names)
print(len(poets), poets)
print(len(poems), poems)
print(len(numbers), numbers)
print(len(dynasties), dynasties)
##################
# 唐诗300首代码结束
##################
python唐诗分析综合_Python爬虫抓取唐诗宋词相关推荐
- python b站 排行_Python爬虫抓取B站小视频排行榜,新手也可以跟着做哦!
Python爬虫学到什么程度就可以去找工作了? 有朋友在群里和大家讨论,问的最多的问题就是,python 爬虫学到什么程度可以去找工作了,关于这点,和大家分享下我的理解. 看大牛用Python实现发送 ...
- Python进阶之Scrapy-redis分布式爬虫抓取当当图书
Python进阶之Scrapy-redis分布式爬虫抓取当当图书 1. 准备工作 1.1 安装scrapy-redis 1.2 在windows安装redis程序 1.3 打开redis服务 2. 需 ...
- python基金预测分析_Python爬虫抓取基金数据分析、预测系统设计与实现
版权声明:本文为博主原创文章,如果转载请给出原文链接:http://doofuu.com/article/4156231.html 目前在开发一款基于Python的基金爬取.分析.预测系统,目前已经开 ...
- python爬虫资源大全_Python爬虫抓取纯静态网站及其资源(基础篇)
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:程序员宝库 **( 想要学习Python?Python ...
- python爬虫网易云音乐最热评论并分析_Python3实现爬虫抓取网易云音乐的热门评论分析(图)...
这篇文章主要给大家介绍了关于Python3实战之爬虫抓取网易云音乐热评的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧. ...
- python爬取大众点评评论_python爬虫抓取数据 小试Python——爬虫抓取大众点评上的数据 - 电脑常识 - 服务器之家...
python爬虫抓取数据 小试Python--爬虫抓取大众点评上的数据 发布时间:2017-04-07
- python爬虫app步骤_Python爬虫抓取手机APP的传输数据,python爬虫抓取app
Python爬虫抓取手机APP的传输数据,python爬虫抓取app 大多数APP里面返回的是json格式数据,或者一堆加密过的数据 .这里以超级课程表APP为例,抓取超级课程表里用户发的话题. 1. ...
- python抓取数据库数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储...
Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...
- python爬虫实现股票数据存储_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储!...
Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...
最新文章
- 表中查询重复的数据,如何通过sql语句查询?
- 模板—主席树(待修改)
- 去除JSP页面中JSTL、EL生成的空行
- 树莓派安装vnc server并设置自启动
- linux 状态码的意义,HTTP状态码是什么?常见的状态码描述都有什么?
- [收藏学习]Linux的实时监测命令
- Kernel Crash kdump 使用指南
- 税控盘版增值税开票软件日志加密算法分析及解密工具
- 索尼( A7II)相机刷中文/汉化
- 【札记】二 先天八卦与后天八卦
- DPI与DFI技术分析
- Java笔记(错题)
- [NPUCTF2020]碰上彩虹,吃定彩虹
- 寄生电容和分布电容的区别
- skimage.io模块读取图片
- java linest_不要再纠结in和exists——JAVA伪代码直白分析二者时间复杂度
- 厦门考计算机竞赛保送北大清华名单,厦门这所学校130人获清华北大等名校保送资格...
- WordPress更新文章实时推送到百度
- 嵌入式设计---(1)嵌入式系统基础
- mplfinance绘制K线图