从笔趣阁(www.biquge.com.tw)爬取整本小说的内容,写入txt文件。

再也不用到处找地方下载了,省的遭遇各种不靠谱。

代码如下:

import urllib.request
from bs4 import BeautifulSoup
import urllib.parseprint('\n笔趣阁小说爬虫小程序\n\n')
o_url='http://www.biquge.com.tw'
novelname=input('本程序不支持模糊查询,请输入正确的小说名称:\n')
if novelname=='':print('未输入小说名称,默认爬取中...')novelname='余罪'
b_novelname=novelname.encode('gbk')
url_novelname=urllib.parse.quote(b_novelname)
url_pre='http://www.biquge.com.tw/modules/article/soshu.php?searchkey=+'
url=url_pre+url_novelname
#print(url)
page=urllib.request.urlopen(url).read().decode('GB18030')
soup=BeautifulSoup(page,'lxml')
n=0
bookname=soup.select('#info > h1')
if bookname==[]:print('未找到图书。')
else:print('找到图书:%s。'% bookname[0].text)print('爬取中...')filename=str(bookname[0].text)+'.txt'fo=open(filename,'w',encoding='utf-8')print('文件将保存至',filename)while True:n+=1link=soup.select('#list > dl > dd:nth-of-type(%s)'% n)if len(link)==1:for i in link[0]:c_url=o_url+i['href']c_page=urllib.request.urlopen(c_url).read().decode('GB18030')c_soup=BeautifulSoup(c_page,'lxml')c_text=c_soup.select('#content')text_0=c_text[0]fo.write('\n\n')fo.write(i.text)fo.write('\n')fo.write(text_0.text)print('正在爬取章节:',i.text)else:breakprint('%s 爬取完毕!'% bookname[0].text)fo.close()

笔趣阁小说站的爬虫小程序相关推荐

  1. 笔趣阁小说-圣墟-爬虫源代码

    import re import requests from bs4 import BeautifulSoupurl = 'http://www.biquge6.com/19_19336/' r = ...

  2. Python爬虫--笔趣阁小说爬取

    Python爬虫–笔趣阁小说爬取 爬虫用到的插件 import requests from lxml import etree 小说目录页 以小说"我有百万技能点"为例,在笔趣阁搜 ...

  3. 【Python项目】Python基于tkinter实现笔趣阁小说下载器(附源码)

    前言 hello,大家好呀~ 笔趣阁小说应该很多小伙伴都知道 但是用Python实现一个笔趣阁小说下载器 那岂不是爽歪歪呀 基于tkinter实现的Python版本的笔趣阁小说下载器今天小编给大家实现 ...

  4. 爬虫练习-爬取笔趣阁小说

    练习一下爬虫,将笔趣阁的小说根据需求目标再爬取下来,本文仅仅学习爬虫技术,大家还是要支持一下正版网站的 思路: Created with Raphaël 2.2.0开始输入书名查询小说是否存在跳转页面 ...

  5. Python爬虫之爬取笔趣阁小说下载到本地文件并且存储到数据库

    学习了python之后,接触到了爬虫,加上我又喜欢看小说,所以就做了一个爬虫的小程序,爬取笔趣阁小说. 程序中一共引入了以下几个库: import requests import mysql.conn ...

  6. Python爬虫练习(一) 爬取新笔趣阁小说(搜索+爬取)

    爬取笔趣阁小说(搜索+爬取) 首先看看最终效果(gif): 实现步骤: 1.探查网站"http://www.xbiquge.la/",看看网站的实现原理. 2.编写搜索功能(获取每 ...

  7. python3+正则(re)增量爬虫爬取笔趣阁小说( 斗罗大陆IV终极斗罗)

    python3+re 爬虫爬取笔趣阁小说 斗罗大陆IV终极斗罗 爬取前准备 导入的模块 分析 正则的贪婪与非贪婪 附完整代码示例 爬取前准备 导入的模块 import redis #redis数据库 ...

  8. java爬虫爬取笔趣阁小说

    java爬虫爬取笔趣阁小说 package novelCrawler;import org.jsoup.Connection; import org.jsoup.HttpStatusException ...

  9. Python爬虫:笔趣阁小说搜索和爬取

    目录 0x00 写在前面 0x01 搜索页面 0x02 章节获取 0x03 章节内容获取 0x04 完整代码 0x00 写在前面 最近开始学习Python的爬虫,就试着写了写笔趣阁小说的爬虫,由于是初 ...

最新文章

  1. python队列学习笔记
  2. goodFeaturesToTrack函数
  3. 获取顶级域名与一级域名的python库-tld
  4. 第九章 PX4-pixhawk-姿态估计解析
  5. c#中mysql远程连接方法及实例
  6. TCP协议下 Socket 与 ServerSocket
  7. 对学生成绩表按计算机应用成绩排序,计算机等级考试EXCEL练习题-12学生成绩表2...
  8. 大学生计算机基础第一章试题,2017年大学生计算机基础试题及答案
  9. 关于NAND Flash调试的一点总结
  10. 中国科学院国家授时中心
  11. excel二维表转化为一维表
  12. 从苹果创业神话看资本运营应集中优势兵力
  13. [COGS755]山海经
  14. 扩散模型又杀疯了!这一次被攻占的领域是...
  15. 小程序源码:王者战力查询,游戏扫码登录,王者巅峰信息查询等等支持流量主收益和CPS收益-多玩法安装简单
  16. 【九九乘法表】javascript做九九乘法表
  17. 爪哇国新游记之十六----泛型单链表类
  18. Google PR劫持(转)
  19. datasnap出现connection closed gracefully错误的解决办法
  20. 《金字塔原理》的读后感作文3100字

热门文章

  1. 【工具配置】【Windows】Cuda和cudnn安装教程(保姆级)
  2. 推荐一个好用的拍照解题的软件?三款老牌拍照解题的软件在这里
  3. 有序广播Ordered broadcasts的使用
  4. Linux快速入手系列二( 文本处理 )
  5. 常见的SEO工具有哪些
  6. 2022中国制造业行业研究报告:(现状、驱动因素、外流现象、发展趋势)27页可下载
  7. linux数据库分析报告,写linux数据
  8. 如何分享10亿月活红利?揭秘拥抱小程序电商的正确姿势
  9. [女人为什么背对男生睡觉 ]
  10. 群友面试的问题 我搞笑的帮忙回答一下