先上代码:

import requests
from bs4 import BeautifulSoup
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.75 Safari/537.36"
}
url="https://www.shicimingju.com/book/sanguoyanyi.html"
page_text=requests.get(url=url,headers=headers).text
#在首页中解析出章节的标题和详情页的url
#实例化BeautifulSoup对象,需要将页面源码数据加载到该对象中
soup=BeautifulSoup(page_text,'lxml')
#解析章节标签和详情页url
li_list=soup.select('.book-mulu > ul > li ')
#持久化储存
fp=open('./sanguo.txt','w',encoding='utf-8')
for li in li_list:title=li.a.stringdetail_url='https://www.shicimingju.com'+li.a['href']#对详情页发请求,解析出章节内容detail_page_text=requests.get(url=detail_url,headers=headers).text#解析出详情页中相关的章节内容detail_soup=BeautifulSoup(detail_page_text,'lxml')div_tag=detail_soup.find('div',class_='chapter_content')#解析到章节的内容content=div_tag.textfp.write(title+':'+content+'\n')print(title,'爬取成功')

网站链接:
https://www.shicimingju.com/book/sanguoyanyi.html

部分代码解析:
打开f12开发者工具


用bs4解析页面就是定位标签的过程,直到把你要的数据找到。

结果展示:

爬虫实例4 爬取网络小说相关推荐

  1. Python3网络爬虫,简单爬取网络小说并下载

    相信我们常常会有想看的小说,但是不能下载,导致无法在没网的环境下观看..下面将解一下如何用python3爬取网络小说. 本文主要是用于学习,希望大家支持正版. 首先我们需要两个包,我们分别是reque ...

  2. python爬虫怎么爬小说_python从爬虫基础到爬取网络小说实例

    一.爬虫基础 1.1 requests类 1.1.1 request的7个方法 requests.request() 实例化一个对象,拥有以下方法 requests.get(url, *args) r ...

  3. python爬虫学习一--爬取网络小说实例

    最近疫情猖獗,长假憋在家里实在无聊,早上突然看了一篇python爬虫文章,当场决定试验一下,参照了一下别人的案例,自己各种踩坑捣鼓了好几个小时,终于成功最后把具体步骤和注意点分享给大家: 1.Pyth ...

  4. python:利用20行代码爬取网络小说

    文章目录 前言 一.爬虫是什么? 二.实现过程 总结 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 今天,来给大家一个分享一下如何使用20爬虫行代码爬取网络小说(这里我们以龙 ...

  5. python爬虫下载小说_用PYTHON爬虫简单爬取网络小说

    用PYTHON爬虫简单爬取网络小说. 这里是17K小说网上,随便找了一本小说,名字是<千万大奖>. 里面主要是三个函数: 1.get_download_url() 用于获取该小说的所有章节 ...

  6. Python爬虫练习 爬取网络小说保存到txt

    原文链接:https://yetingyun.blog.csdn.net/article/details/107916769 创作不易,未经作者允许,禁止转载,更勿做其他用途,违者必究. 利用 Pyt ...

  7. Python爬虫之爬取网络小说并在本地保存为txt文件

    Python爬虫之爬取网络小说并在本地保存为txt文件 注:本文使用软件为Sublime Text,浏览器为谷歌浏览器 (新手小白第一次写,写得不好请见谅) **1.**首先找到想要爬取的小说章节目录 ...

  8. 用PYTHON爬虫简单爬取网络小说

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  9. 【网络爬虫】爬取网络小说并保存为txt

    爬虫爬取网络小说并保存为txt文件 最近突然想看小说,但是苦于无法下载为txt,于是秉持着"自己动手,丰衣足食"的原则,自己写了一个爬虫,仅供参考~ 这里就以火星引力的<逆天 ...

  10. python爬取小说写入txt_Python爬虫练习 爬取网络小说保存到txt

    利用python爬虫爬取网络小说保存到txt,熟悉利用python抓取文本数据的方法. 选取其中某一章,检查网页,可以找到这本小说所有章节的链接和名称. 写出xpath表达式提取出href里的内容:/ ...

最新文章

  1. 马斯克刚刚宣布辞去特斯拉董事会职务,仍然担任CEO
  2. 为了追求极致的性能,Kafka掌控这11项要领
  3. MongoDB最简单的入门教程之一 环境搭建
  4. 【啃不完的算法导论】- 动态规划 - 最长公共子序列(概念篇)
  5. python如何统计累计每日的人数‘’_Python数据分析2019陕西高考(理工)成绩及填报志愿...
  6. 简述数据库事务并发机制
  7. python css_Python-CSS整理
  8. 软件项目成员的业绩考核
  9. kali linux 2019.1 替换burpsuite pro 1.7.37
  10. 使用源码安装 PostgreSQL 12.5 主从集群
  11. 数组元素的填充与替换、排序和复制
  12. FFA 2021 专场解读 - 开源解决方案 / 流批一体
  13. 转载一篇理解堆和栈区别的好文章
  14. 任务调度:分布式调度引擎-DAGScheduleX简介
  15. struts1和2的区别总结
  16. HTTP协议报文头部结构和Web相关工具
  17. windows基线加固
  18. 我的春招实习+秋招总结【前端开发】
  19. 手动更新HomeAssistant版本
  20. 页面增加问号图标,鼠标放置会提示文字信息。(记录日志)

热门文章

  1. mysql cluster安装报错
  2. C++day14 学习笔记
  3. linux图标大全——这些你认识多少?
  4. 52.网络参数管理者: DHCP
  5. 6. JavaScript String 对象
  6. 特斯拉线圈怎么用_无线快充居然是特斯拉发明的?不愧是发明家
  7. day 34 进程线程排序 抢票 初级生产者消费者
  8. php 常用正则表达 邮箱 手机号啥的
  9. 萌新学习笔记之线性表
  10. oracle常用命令(比较常见好用)