爬虫实例4 爬取网络小说
先上代码:
import requests
from bs4 import BeautifulSoup
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.75 Safari/537.36"
}
url="https://www.shicimingju.com/book/sanguoyanyi.html"
page_text=requests.get(url=url,headers=headers).text
#在首页中解析出章节的标题和详情页的url
#实例化BeautifulSoup对象,需要将页面源码数据加载到该对象中
soup=BeautifulSoup(page_text,'lxml')
#解析章节标签和详情页url
li_list=soup.select('.book-mulu > ul > li ')
#持久化储存
fp=open('./sanguo.txt','w',encoding='utf-8')
for li in li_list:title=li.a.stringdetail_url='https://www.shicimingju.com'+li.a['href']#对详情页发请求,解析出章节内容detail_page_text=requests.get(url=detail_url,headers=headers).text#解析出详情页中相关的章节内容detail_soup=BeautifulSoup(detail_page_text,'lxml')div_tag=detail_soup.find('div',class_='chapter_content')#解析到章节的内容content=div_tag.textfp.write(title+':'+content+'\n')print(title,'爬取成功')
网站链接:
https://www.shicimingju.com/book/sanguoyanyi.html
部分代码解析:
打开f12开发者工具
用bs4解析页面就是定位标签的过程,直到把你要的数据找到。
结果展示:
爬虫实例4 爬取网络小说相关推荐
- Python3网络爬虫,简单爬取网络小说并下载
相信我们常常会有想看的小说,但是不能下载,导致无法在没网的环境下观看..下面将解一下如何用python3爬取网络小说. 本文主要是用于学习,希望大家支持正版. 首先我们需要两个包,我们分别是reque ...
- python爬虫怎么爬小说_python从爬虫基础到爬取网络小说实例
一.爬虫基础 1.1 requests类 1.1.1 request的7个方法 requests.request() 实例化一个对象,拥有以下方法 requests.get(url, *args) r ...
- python爬虫学习一--爬取网络小说实例
最近疫情猖獗,长假憋在家里实在无聊,早上突然看了一篇python爬虫文章,当场决定试验一下,参照了一下别人的案例,自己各种踩坑捣鼓了好几个小时,终于成功最后把具体步骤和注意点分享给大家: 1.Pyth ...
- python:利用20行代码爬取网络小说
文章目录 前言 一.爬虫是什么? 二.实现过程 总结 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 今天,来给大家一个分享一下如何使用20爬虫行代码爬取网络小说(这里我们以龙 ...
- python爬虫下载小说_用PYTHON爬虫简单爬取网络小说
用PYTHON爬虫简单爬取网络小说. 这里是17K小说网上,随便找了一本小说,名字是<千万大奖>. 里面主要是三个函数: 1.get_download_url() 用于获取该小说的所有章节 ...
- Python爬虫练习 爬取网络小说保存到txt
原文链接:https://yetingyun.blog.csdn.net/article/details/107916769 创作不易,未经作者允许,禁止转载,更勿做其他用途,违者必究. 利用 Pyt ...
- Python爬虫之爬取网络小说并在本地保存为txt文件
Python爬虫之爬取网络小说并在本地保存为txt文件 注:本文使用软件为Sublime Text,浏览器为谷歌浏览器 (新手小白第一次写,写得不好请见谅) **1.**首先找到想要爬取的小说章节目录 ...
- 用PYTHON爬虫简单爬取网络小说
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...
- 【网络爬虫】爬取网络小说并保存为txt
爬虫爬取网络小说并保存为txt文件 最近突然想看小说,但是苦于无法下载为txt,于是秉持着"自己动手,丰衣足食"的原则,自己写了一个爬虫,仅供参考~ 这里就以火星引力的<逆天 ...
- python爬取小说写入txt_Python爬虫练习 爬取网络小说保存到txt
利用python爬虫爬取网络小说保存到txt,熟悉利用python抓取文本数据的方法. 选取其中某一章,检查网页,可以找到这本小说所有章节的链接和名称. 写出xpath表达式提取出href里的内容:/ ...
最新文章
- 马斯克刚刚宣布辞去特斯拉董事会职务,仍然担任CEO
- 为了追求极致的性能,Kafka掌控这11项要领
- MongoDB最简单的入门教程之一 环境搭建
- 【啃不完的算法导论】- 动态规划 - 最长公共子序列(概念篇)
- python如何统计累计每日的人数‘’_Python数据分析2019陕西高考(理工)成绩及填报志愿...
- 简述数据库事务并发机制
- python css_Python-CSS整理
- 软件项目成员的业绩考核
- kali linux 2019.1 替换burpsuite pro 1.7.37
- 使用源码安装 PostgreSQL 12.5 主从集群
- 数组元素的填充与替换、排序和复制
- FFA 2021 专场解读 - 开源解决方案 / 流批一体
- 转载一篇理解堆和栈区别的好文章
- 任务调度:分布式调度引擎-DAGScheduleX简介
- struts1和2的区别总结
- HTTP协议报文头部结构和Web相关工具
- windows基线加固
- 我的春招实习+秋招总结【前端开发】
- 手动更新HomeAssistant版本
- 页面增加问号图标,鼠标放置会提示文字信息。(记录日志)