今天做的练习是在网站上爬虫某一部小说,并将其存入到文档中~~
首先,按照上一次爬虫的步骤,获取到该小说目录页的url
url=“https://www.kanunu8.com/book2/10881/”
注:若print出该页内容为乱码时,因考虑到编码方式的转换;
在这次爬虫过程中,我们需要将编码进行转换,将其转换为gbk形式,所使用的语句如下:
txt=requests.get(url).content.decode(“gbk”)
具体实现代码如下:

过程中遇到过的错误:
expected string or bytes-like object 这是由于数据类型不匹配造成的
findall获取的为一个列表,而sub需要对字符串进行操作,所以此处需要现将列表中的字符串取出,再进行替换

接下来就是成果图了:



嗯嗯~~就是这样啦

Python小说爬虫相关推荐

  1. 简单 python 小说爬虫 ultimate

    简单 python 小说爬虫 想爬就爬 带txt配置文件 day01(半成品) 划掉 - day02(成品) 书名 史上第一剑修 笔趣阁 url代码里找 ####################### ...

  2. python 小说爬虫_Python实现的爬取小说爬虫功能示例

    本文实例讲述了Python实现的爬取小说爬虫功能.分享给大家供大家参考,具体如下: 想把顶点小说网上的一篇持续更新的小说下下来,就写了一个简单的爬虫,可以爬取爬取各个章节的内容,保存到txt文档中,支 ...

  3. 小说网站竟然没有下载功能?跟小姐姐学会这个python小说爬虫,把全文小说带回家!

    hello大家好,我是你们的可爱丸,不知道你们有没有遇到过这种情况: 自己喜欢的小说竟然只能看不能下载??? 作为一个python学习者,这种情况当然不能忍,那么今天我就教大家用python写一个小说 ...

  4. python 小说爬虫_从零开始写Python爬虫 --- 1.7 爬虫实践: 排行榜小说批量下载

    从零开始写Python爬虫 --- 1.7 爬虫实践: 排行榜小说批量下载Ehco 5 个月前 本来只是准备做一个爬起点小说名字的爬虫,后来想了一下,为啥不顺便把小说的内容也爬下来呢?于是我就写了这个 ...

  5. python 小说爬虫_用Python爬虫下载整本小说

    1 / 写在前面的话 / 如今网络上很多小说网站都有免费的小说阅读,但是它不提供下载全本的服务,目的也是为了获得更多的流量,资源君就不服了,今天刚好看到一个小说网站,就想弄本小说来看看,于是拿起电脑, ...

  6. python 小说爬虫_小说爬虫python

    在线观看多费劲呀,不如爬下来看 小说网站地址:http://www.quanshuwang.com/ 分析: 第一种方法: 首先随便打开一个小说章节详情页,比如莽荒记 发现这个详情页,居然包含了所有章 ...

  7. python小说爬虫实训报告_1.2Python网络爬虫实践(1)爬取89文学网小说

    import requests from bs4 import BeautifulSoup import time import os # 获取所有章节的链接 def get_novel_chapte ...

  8. python小说爬虫实训报告_python之新手一看就懂的小说爬虫

    晚上回来学学爬虫,记住,很多网站一般新手是爬不出来的,来个简单的,往下看: import urllib.request from bs4 import BeautifulSoup #我用的pychar ...

  9. python网络爬虫_Python爬虫实战之网络小说

    今天和大家分享的是python爬虫实战,由于本人最近迷上了看网络小说,学生党又穷,只能看看网络dao版小说,现在这类dao版小说网站可以说非常的多,但是所有的网站进去都可以看见一大把的广告信息,非常影 ...

最新文章

  1. 题目1460:Oil Deposit
  2. java简单的ID生成器
  3. 获取iframe中的contentWindow
  4. 网交会引发的新交易机会
  5. 在VS2005中使用添加变量向导十分的
  6. 数据结构实验之排序三:bucket sort
  7. 阿里云重磅推出物联网设备身份认证Link ID²
  8. c#: using Microsoft.Office.Interop.Excel 异常
  9. linux 加密文件,如何运用OpenSSL 对文件进行加密和解密
  10. 十大算法 — 选择排序法【C语言代码诠释】
  11. Python全栈开发——线程与进程的概念
  12. 如何选择好的上海自媒体招聘平台
  13. matlab 线性拟合polyfit_Matlab 线性拟合 非线性拟合_matlab非线性拟合函数
  14. 宇枫资本年轻人投资理财的方法
  15. ip 地址在线解析, api
  16. czl蒻蒟的OI之路13
  17. 计算机二级word插入图表,四步教你在excel柱形图上添加折线图
  18. 弗洛伊德与他的精神分析学
  19. 给新手学习MySQL的建议
  20. 【红外】数字细节增强算法的缘由效果如何评价效果(我对FLIR算法文档详解)

热门文章

  1. 【学习笔记】FI-AR模块概述
  2. 【MM模块】Stock transfersTransfer posting 转储和调拨
  3. 重复制造--REM主数据
  4. PP管和PPR管的区别在哪
  5. 批量生成销售订单、退货订单
  6. SAP FICO年结
  7. 一封绝妙的情书 An Ingenious Love Letter
  8. MySQL主从压_mysql主从配置
  9. 快速排序算法_基于位运算的快速排序算法
  10. root域名服务器 gtld服务器_购买阿里云域名和空间服务器实操