爬虫背景

目的:爬取诗词名著网上的小说
网页:http://www.shicimingju.com/book/sanguoyanyi.html
分析过程:
1、查找当前页面多个章节的URL
2、打开每个章节保存文字内容

代码如下:

import requests
from bs4 import BeautifulSoupurl = 'http://www.shicimingju.com/book/sanguoyanyi.html'
header = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'}
res = requests.get(url,headers=header).textsoup = BeautifulSoup(res,'html.parser')
mulu = soup.find('div',class_='book-mulu').find_all('a')
book_name = soup.h1.string
chapter_url = ['http://www.shicimingju.com'+x['href'] for x in mulu]f=open(book_name+'.txt','a',encoding='utf-8')
for i in chapter_url:res = requests.get(i,headers=header).textsoup = BeautifulSoup(res,'html.parser')contents = soup.find('div',class_='card bookmark-list').get_text()f.write(contents)

BeautifulSoup编写PYTHON爬虫案例-下载名著小说相关推荐

  1. Python爬虫实战——下载小说

    Python爬虫实战--下载小说 前言 第三方库的安装 示例代码 效果演示 结尾 前言 使用requests库下载开源网站的小说 注意:本文仅用于学习交流,禁止用于盈利或侵权行为. 操作系统:wind ...

  2. Python 爬虫案例(二)--附件下载

    Python 爬虫案例(二) 此篇文章将爬取的网站是:http://www.warrensburg-mo.com/Bids.aspx (有时候打开不一定会有标书,因为标书实时更新) 类型跟上一篇相似, ...

  3. python网络爬虫的基本步骤-黑客基础 编写Python爬虫入门步骤

    原标题:黑客基础 编写Python爬虫入门步骤 信息时代,数据就是宝藏.数据的背后隐含着无穷的宝藏,这些宝藏也许就是信息量所带来的商业价值,而大数据本身也将成为桌面上的筹码. 黑客花无涯 带你走进黑客 ...

  4. python爬虫步骤-黑客基础 编写Python爬虫入门步骤

    原标题:黑客基础 编写Python爬虫入门步骤 信息时代,数据就是宝藏.数据的背后隐含着无穷的宝藏,这些宝藏也许就是信息量所带来的商业价值,而大数据本身也将成为桌面上的筹码. 黑客花无涯 带你走进黑客 ...

  5. python爬虫简单实例-最简单的Python爬虫案例,看得懂说明你已入门,附赠教程

    原标题:最简单的Python爬虫案例,看得懂说明你已入门,附赠教程 这是最简单的Python爬虫案例,如果你能看懂,那么请你保持信心,因为你已经入门Python爬虫,只要带着信心和努力,你的技术能力在 ...

  6. python爬虫案例——糗事百科数据采集

    全栈工程师开发手册 (作者:栾鹏) python教程全解 python爬虫案例--糗事百科数据采集 通过python实现糗事百科页面的内容采集是相对来说比较容易的,因为糗事百科不需要登陆,不需要coo ...

  7. python爬虫案例——csdn数据采集

    全栈工程师开发手册 (作者:栾鹏) python教程全解 python爬虫案例--csdn数据采集 通过python实现csdn页面的内容采集是相对来说比较容易的,因为csdn不需要登陆,不需要coo ...

  8. 如何编写Python爬虫

    Python是一种非常流行的编程语言,用于编写各种类型的应用程序,包括网络爬虫.在本文中,我们将介绍如何使用Python编写一个简单的网络爬虫. 步骤1:安装Python 首先,您需要安装Python ...

  9. python爬虫下载-python爬虫之下载文件的方式总结以及程序实例

    python爬虫之下载文件的方式以及下载实例 目录 第一种方法:urlretrieve方法下载 第二种方法:request download 第三种方法:视频文件.大型文件下载 实战演示 第一种方法: ...

最新文章

  1. 理财心理陷阱之:年终奖——年末的虚假繁荣
  2. NSMutableParagraphStyle /NSParagraphStyle
  3. TVS选型(车载电子产品篇)
  4. SEO技巧:好的域名是网站成功的开始
  5. 成绩转换(百分制到五级制的转换)-(只作新手参考)
  6. sp根据备份文件来创建DB
  7. python做图片浏览器_保护隐私,用Python打造自己的照片浏览器
  8. C# WebService获取天气信息
  9. 如何终止线程的运行(C/C++)
  10. Linux定时执行php
  11. 8个优秀的CSS实践,超详细
  12. 根据指定时间范围取得对应(第几)周信息,以及一年当中所有周时间范围列表信息(可用于学期第几周,年第几周)
  13. 计算机毕业设计Java基于的药品销售系统(源码+系统+mysql数据库+lW文档)
  14. 撤销commit操作
  15. 20、CSS中单位:【px和%】【em和rem】【vw|vh|vmin|vmax】的区别
  16. 50个最佳机器学习公共数据集
  17. Maxon将在Siggraph 2019公布下一代Cinema 4D RELEASE 21
  18. “目前没有可用的登录服务器处理登录请求”解决方案
  19. linux原生系统_技德发布JStack 2.0,在Linux系统中无缝运行移动应用
  20. 第一篇Java基础知识 复习博客

热门文章

  1. 卡方值c 语言编程,amos的操作步骤与程序
  2. DOS下解压缩ZIP文件
  3. mysql数据库实验报告二
  4. php 即时通讯 app,即时通讯软件有什么
  5. Unity3D 飞碟游戏改进版
  6. 桌面计算机怎么设置时钟同步,win10怎样设置电脑时间同步
  7. 如何设计股权激励的有效性?
  8. 【C语言】自定义类型(结构体、位段、枚举、联合体)与内存对齐
  9. 两步教你轻松写出时事热点型软文营销文案
  10. H3C防火墙授权相关问题