为什么80%的码农都做不了架构师?>>>   

####Calibre 制作电子书

Calibre支持使用Python语言编写脚本,抓取网页内容生成电子书,默认为mobi格式

  1. 在抓取新闻的下拉菜单中选择添加自定义新闻源
  2. New Recipe---切换到高级模式,默认提供了代码模板,只需要添加自定义的网页来源
  3. 编写Recipe文件代码
  4. 抓取新闻,选择自定义来源,下载即可
#!/usr/bin/env python
# vim:fileencoding=utf-8
from __future__ import unicode_literals, division, absolute_import, print_function
from calibre.web.feeds.news import BasicNewsRecipeclass liaoxuefeng_python(BasicNewsRecipe):'''自定义的Recipe都继承自Calibre提供的基类BasicNewsRecipe,必须实现parse_index()方法'''#电子书名称title          = '廖雪峰Python教程3'description = 'python教程'max_articles_per_feed = 200# 设置每隔1s下载一个章节,默认值为0,当网络不好时,可以把这个值调大点delay = 1   url_prefix = 'http://www.liaoxuefeng.com'no_stylesheets = True#抓取每一个页面中保留的tagkeep_only_tags = [{ 'class': 'x-content' }]#页面中删除的Tagremove_tags=[{'class':'x-wiki-info'}]#指定Tag之后的元素都被删除remove_tags_after=[{'class':'x-wiki-content'}]def get_title(self, link):return link.contents[0].strip()def parse_index(self):#index_to_soup()由BasicNewsRecipe实现,使用Beautifulsoup抓取一个网址,并获得这个网页内容的soup对象soup = self.index_to_soup('http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000')# 左侧导航栏div = soup.find('div', { 'class': 'x-sidebar-left-content' })# 找到每一个章节的标题和对应的URL,Calibre会下载每一个URL的html,使用上面的类属性进行解析articles = []for link in div.findAll('a'):til = self.get_title(link)url = self.url_prefix + link['href']a = { 'title': til, 'url': url }articles.append(a)#返回一个列表,这个列表中是多个元组,每个元组是书的一卷('廖雪峰python教程', articles),每一卷中又有多个章节articlestutorial = [('廖雪峰python教程', articles)]return tutorial

参考: 用calibre和python制作电子书---Python和Git教程

转载于:https://my.oschina.net/aquar/blog/611856

Calibre 制作电子书相关推荐

  1. 使用python多线程下载网络小说并结合calibre制作电子书

    之前的教程里有写过python爬取小说的代码,但如果小说字数很多,爬起来会比较耗时.此时需要结合多线程来加快爬取速度. 代码如下: import requests from lxml import e ...

  2. 用calibre抓取RSS新闻制作电子书及推送到kindle

    calibre可以从RSS源抓取内容,转换成它所支持格式的电子书,还可以推送到阅读器设备.下面来看看在calibre图形界面和命令行下如何实现这些功能. 在图形界面抓取新闻 自定义新闻来源 看看我们自 ...

  3. 【kindle】使用Typora+Calibre自制电子书

    [工具准备] 1. Markdown编辑器Typora 个人比较强迫症偏爱格式漂亮的编辑器,用来记笔记很方便,用Word替代也可以,只是作为原始文档准备制作电子书的输入 2.Calibre电子书管理器 ...

  4. 如何用 Python 爬取网页制作电子书

    本文来自作者 孙亖 在 GitChat 上分享 「如何用 Python 爬取网页制作电子书」,「阅读原文」查看交流实录. 「文末高能」 编辑 | 哈比 0 前言 有人爬取数据分析黄金周旅游景点,有人爬 ...

  5. GitBook制作电子书使用教程

    一.概述 [官网]https://www.gitbook.com/ 参考:https://chrisniael.gitbooks.io/gitbook-documentation/content/bu ...

  6. MacOS使用GitBook制作电子书

    目录 目录 一.简介 二.安装 1. 安装node.js 2. 安装gitbook 三.使用 四.常用命令 1. 初始化 或 编辑目录 2. 编辑内容之后编译书籍 3. 启动web服务通过浏览器预览数 ...

  7. gitbook通过markdown制作电子书

    gitbook通过markdown制作电子书 环境: gitbook-cli: 2.3.2(2017-07-14) gitbook: 3.2.3(2017-08-03) Node.js: 10.24. ...

  8. Windows上使用gitbook制作电子书

    0. 前言 第一次在windows上使用gitbook制作电子书,在网上搜了好多资料,自己亲手试了下并整理如下. 1. 准备工具 Step1: 下载nodejs(nodejs中文官方): http:/ ...

  9. (转载) 如何制作电子书?

    电子书(eBook)是一种电子读物,它极大地方便了信息的传播,存储,同时也给我们的学习和工作带来了很多便利之处.比如可以把许多文摘制作成一本电子书,图文并茂,界面美观,既方便阅读又可以很好的保存. 网 ...

最新文章

  1. 使用spring aop实现业务层mysql 读写分离
  2. oracle linux 配置本地yum,oracle linux配置本地光盘yum源
  3. 谭浩强C语言程序设计 学习辅导练习题
  4. 鳄鱼洗澡安卓版关卡重置
  5. 工具类集和_gblfy版本
  6. 【转】[原创]LoadRunner如何监控Linux系统资源
  7. (139)FPGA面试题-FPGA设计中的速度和面积互换原则
  8. 基于SSM的勤工助学管理系统
  9. Windows Embedded CE 中断结构分析
  10. 【指纹识别】基于matlab GUI指纹识别【含Matlab源码 586期】
  11. 定时任务及分布式定时任务注意事项
  12. appuim + python 实现 趣头条 自动阅读
  13. Qt —— 完美制作win系统扬声器、麦克风控制程序
  14. 深入浅出曲面的切平面方程和曲面的法线方程
  15. HardLink SymbolLink Junctions
  16. CSDN如何修改自己的博客名称
  17. 小菜鸟的自我激励与不服输的心
  18. 马斯克把飞船方向盘用在特斯拉新车上!乞丐版80万起
  19. C#(pronounced: see sharp) 与 .NET
  20. char类型的取值范围

热门文章

  1. Django 开发框架学习(一)
  2. 【超详解】JavaWeb三大组件讲解
  3. MPC算法轨迹跟踪控制资源
  4. 基于SIMULINK的燃烧过程模糊PID控制系统仿真
  5. 数组双指针之快慢指针
  6. 产品-Axure9(英文版),原型设计 制作下拉二级菜单
  7. 基于51单片机语音录音机存储与播放回放系统设计
  8. 彻底解决LSASS.exe进程病毒!
  9. 七彩虹技术服务论坛硬件驱动更新指南(添加Vista支持)
  10. Flutter 学习第三天 面向对象 和 库的使用