最近搞PY停不下来,各种爬啊

最近在外国人网站上看到比较有意思的小说,诡秘之主,比较好看,用浏览器打开看好麻烦, 还有各种搞HS的网站不小心点到了。

想着搞下PY下载下来看,爽歪歪!

首先是用的Python3.7导入requests和BS4

利用requests和Soup

定义函数搞事情!这里获取的免费小说网站是http://www.147xs.org

里面有诡秘免费全本!

先爬主站:

再爬出页内内容:

爬取到了内容:

with open(guimi.txt','a',encoding='utf-8') as file:

最后主函数再直接用个For 循环直接爬到该站所有网页的内容,完成,处理下txt分段,导入手机阅读器,开始美滋滋阅读~~

Python爬虫爬小说《诡秘之主》相关推荐

  1. Python爬虫爬取纵横中文网小说

    Python爬虫爬取纵横中文网小说 学了一周的爬虫,搞了这个东西,自己感觉还不错,有什么问题可以提一提哈 目标:纵横中文网-完本-免费小说 网址:http://book.zongheng.com/st ...

  2. python爬虫爬取《斗破苍穹》小说全文

    网络爬虫的入门学习:python爬虫爬取小说全文 python爬虫首先导入基本爬虫库requests:import requests,安装命令pip install requests,使用pychar ...

  3. python爬虫17K小说网资料

    python爬虫17K小说网资料 爬虫作业要求:抓取小说网站为例,必须抓取一系列小说(不是一部小说)的篇名.作者.出版单位(或首发网站).出版时间(或网上发布时间).内容简介.小说封面图画.价格.读者 ...

  4. 在当当买了python怎么下载源代码-python爬虫爬取当当网

    [实例简介]python爬虫爬取当当网 [实例截图] [核心代码] ''' Function: 当当网图书爬虫 Author: Charles 微信公众号: Charles的皮卡丘 ''' impor ...

  5. python爬虫爬取csdn博客专家所有博客内容

    python爬虫爬取csdn博客专家所有博客内容: 全部过程采取自动识别与抓取,抓取结果是将一个博主的所有 文章存放在以其名字命名的文件内,代码如下 #coding:utf-8import urlli ...

  6. python如何爬取网站所有目录_用python爬虫爬取网站的章节目录及其网址

    认识爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模拟 ...

  7. Python爬虫|爬取喜马拉雅音频

    "GOOD Python爬虫|爬取喜马拉雅音频 喜马拉雅是知名的专业的音频分享平台,用户规模突破4.8亿,汇集了有声小说,有声读物,儿童睡前故事,相声小品等数亿条音频,成为国内发展最快.规模 ...

  8. Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中

    Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中 1.需要的Python模块 主要是requests模块,用于得到的网页的数据 安装命令为:pip install requests 2 ...

  9. python爬虫爬取当当网的商品信息

    python爬虫爬取当当网的商品信息 一.环境搭建 二.简介 三.当当网网页分析 1.分析网页的url规律 2.解析网页html页面 书籍商品html页面解析 其他商品html页面解析 四.代码实现 ...

最新文章

  1. day060 ajax文件上传 json补充
  2. python语言中文社区-Python 之父谈 Python-Go语言中文社区
  3. C#中对文件进行选择对话框打开和保存对话框进行复制
  4. 修改 堆栈大小 普适性方案总结 (跨平台 windows linux 栈设置大小)
  5. pip 安装模块时报“pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonh”
  6. exls导入数据库 php_PHP读取excel文件并导入数据库
  7. C++ inline内联函数详解
  8. Java多态提现_Java中的多态的一些体现,重写和包装类
  9. esxi linux 网络不可达,将ESXI所有的端口组迁移到分布式交换机的步骤
  10. lol服务器维护 胜率,说下这游戏服务器控制胜率怎么来的。
  11. 元气骑士卡无限服务器,元气骑士养剑葫怎么卡无限飞剑bug方法介绍
  12. 服务器配置与软件安装合集
  13. 元祖字典 java_元祖和字典
  14. C++ 静态成员变量和静态成员函数
  15. Cocos2d-x 中文内容设置
  16. 你说 文/江湖一劍客
  17. 盈动电子书包助力教育行业信息化发展
  18. 【线性代数】拉普拉斯定理
  19. 如何部署会议室多屏同步显示系统
  20. el-table的动态表头设置fixed后对不齐的问题

热门文章

  1. 互联网名词有哪些?读了这篇就够了
  2. 新手小白之初识JAVA,随堂笔记
  3. Vue+Vant制作单选全选全不选以及删除按钮van-checkbox
  4. 爬虫--智联爬取--拼接链接的演示
  5. ERP : 产出控制
  6. us域名,什么是us域名?
  7. 没有参加职工养保不要紧,城乡居民基本养老保险了解一下~
  8. 标准盒子模型与怪异盒子模型
  9. Windows 11强势来袭,一文带你了解全部更新内容
  10. windows蓝牙编程——1 扫描周边蓝牙并获取蓝牙信息