Calibre 制作电子书
为什么80%的码农都做不了架构师?>>>
####Calibre 制作电子书
Calibre支持使用Python语言编写脚本,抓取网页内容生成电子书,默认为mobi格式
- 在抓取新闻的下拉菜单中选择添加自定义新闻源
- New Recipe---切换到高级模式,默认提供了代码模板,只需要添加自定义的网页来源
- 编写Recipe文件代码
- 抓取新闻,选择自定义来源,下载即可
#!/usr/bin/env python
# vim:fileencoding=utf-8
from __future__ import unicode_literals, division, absolute_import, print_function
from calibre.web.feeds.news import BasicNewsRecipeclass liaoxuefeng_python(BasicNewsRecipe):'''自定义的Recipe都继承自Calibre提供的基类BasicNewsRecipe,必须实现parse_index()方法'''#电子书名称title = '廖雪峰Python教程3'description = 'python教程'max_articles_per_feed = 200# 设置每隔1s下载一个章节,默认值为0,当网络不好时,可以把这个值调大点delay = 1 url_prefix = 'http://www.liaoxuefeng.com'no_stylesheets = True#抓取每一个页面中保留的tagkeep_only_tags = [{ 'class': 'x-content' }]#页面中删除的Tagremove_tags=[{'class':'x-wiki-info'}]#指定Tag之后的元素都被删除remove_tags_after=[{'class':'x-wiki-content'}]def get_title(self, link):return link.contents[0].strip()def parse_index(self):#index_to_soup()由BasicNewsRecipe实现,使用Beautifulsoup抓取一个网址,并获得这个网页内容的soup对象soup = self.index_to_soup('http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000')# 左侧导航栏div = soup.find('div', { 'class': 'x-sidebar-left-content' })# 找到每一个章节的标题和对应的URL,Calibre会下载每一个URL的html,使用上面的类属性进行解析articles = []for link in div.findAll('a'):til = self.get_title(link)url = self.url_prefix + link['href']a = { 'title': til, 'url': url }articles.append(a)#返回一个列表,这个列表中是多个元组,每个元组是书的一卷('廖雪峰python教程', articles),每一卷中又有多个章节articlestutorial = [('廖雪峰python教程', articles)]return tutorial
参考: 用calibre和python制作电子书---Python和Git教程
转载于:https://my.oschina.net/aquar/blog/611856
Calibre 制作电子书相关推荐
- 使用python多线程下载网络小说并结合calibre制作电子书
之前的教程里有写过python爬取小说的代码,但如果小说字数很多,爬起来会比较耗时.此时需要结合多线程来加快爬取速度. 代码如下: import requests from lxml import e ...
- 用calibre抓取RSS新闻制作电子书及推送到kindle
calibre可以从RSS源抓取内容,转换成它所支持格式的电子书,还可以推送到阅读器设备.下面来看看在calibre图形界面和命令行下如何实现这些功能. 在图形界面抓取新闻 自定义新闻来源 看看我们自 ...
- 【kindle】使用Typora+Calibre自制电子书
[工具准备] 1. Markdown编辑器Typora 个人比较强迫症偏爱格式漂亮的编辑器,用来记笔记很方便,用Word替代也可以,只是作为原始文档准备制作电子书的输入 2.Calibre电子书管理器 ...
- 如何用 Python 爬取网页制作电子书
本文来自作者 孙亖 在 GitChat 上分享 「如何用 Python 爬取网页制作电子书」,「阅读原文」查看交流实录. 「文末高能」 编辑 | 哈比 0 前言 有人爬取数据分析黄金周旅游景点,有人爬 ...
- GitBook制作电子书使用教程
一.概述 [官网]https://www.gitbook.com/ 参考:https://chrisniael.gitbooks.io/gitbook-documentation/content/bu ...
- MacOS使用GitBook制作电子书
目录 目录 一.简介 二.安装 1. 安装node.js 2. 安装gitbook 三.使用 四.常用命令 1. 初始化 或 编辑目录 2. 编辑内容之后编译书籍 3. 启动web服务通过浏览器预览数 ...
- gitbook通过markdown制作电子书
gitbook通过markdown制作电子书 环境: gitbook-cli: 2.3.2(2017-07-14) gitbook: 3.2.3(2017-08-03) Node.js: 10.24. ...
- Windows上使用gitbook制作电子书
0. 前言 第一次在windows上使用gitbook制作电子书,在网上搜了好多资料,自己亲手试了下并整理如下. 1. 准备工具 Step1: 下载nodejs(nodejs中文官方): http:/ ...
- (转载) 如何制作电子书?
电子书(eBook)是一种电子读物,它极大地方便了信息的传播,存储,同时也给我们的学习和工作带来了很多便利之处.比如可以把许多文摘制作成一本电子书,图文并茂,界面美观,既方便阅读又可以很好的保存. 网 ...
最新文章
- 使用spring aop实现业务层mysql 读写分离
- oracle linux 配置本地yum,oracle linux配置本地光盘yum源
- 谭浩强C语言程序设计 学习辅导练习题
- 鳄鱼洗澡安卓版关卡重置
- 工具类集和_gblfy版本
- 【转】[原创]LoadRunner如何监控Linux系统资源
- (139)FPGA面试题-FPGA设计中的速度和面积互换原则
- 基于SSM的勤工助学管理系统
- Windows Embedded CE 中断结构分析
- 【指纹识别】基于matlab GUI指纹识别【含Matlab源码 586期】
- 定时任务及分布式定时任务注意事项
- appuim + python 实现 趣头条 自动阅读
- Qt —— 完美制作win系统扬声器、麦克风控制程序
- 深入浅出曲面的切平面方程和曲面的法线方程
- HardLink SymbolLink Junctions
- CSDN如何修改自己的博客名称
- 小菜鸟的自我激励与不服输的心
- 马斯克把飞船方向盘用在特斯拉新车上!乞丐版80万起
- C#(pronounced: see sharp) 与 .NET
- char类型的取值范围