抽取python 标准库页面生成 mobi 离线文件
前段时间买了个 kindle ,所以就不想老是开电脑 看 书了。而在学习python 时,看到python 主要的还是熟悉一些库的功能。
所以就想着把标准库给捉下来看。
python 标准库: https://docs.python.org/2/library/
下面是一段用来练手的 python 捉取html 内容的代码:
import urllib2import osimport re#打开并保存hmtldef save_html(urlname):main_url=r'https://docs.python.org/2/library/'main_dir=r'E:BOOKpythonpython_library'url=main_url+urlname+'.html'file_name=main_dir+'\' +urlname+'.html'try: req=urllib2.urlopen(url)urlfile=open(file_name,'w')urlfile.write(req.read())except:print urlfinally:urlfile.close()#保存主页save_html('index')#正则表达式查找链接并保存对应文件req=urllib2.urlopen(r'https://docs.python.org/2/library/index.html')p=re.compile(r'''<li class="toctree-.+?"><a class="reference internal" href="(.+?).html">.+?</a></li>''')matchs=p.findall(req.read())for row in matchs:save_html(row)
捉完后,使用了 [ calibre - E-book management ] 把html 转换成mobi 格式的文件。
mobi 下载链接:
http://f.dataguru.cn/forum.php?mod=attachment&aid=MTQ5OTQzfDc1Y2MyMDk5fDE0MDgxNzEzNTB8NDQxMTd8MzM3NjMy
抽取python 标准库页面生成 mobi 离线文件相关推荐
- Python 标准库之 shutil 高阶文件操作『详细』
Python标准库之 shutil 高阶文件操作『详细』 文章目录 Python标准库之 shutil 高阶文件操作『详细』 一.Python shutil介绍
- Python标准库shutil的使用( 文件复制删除、文件夹复制删除、压缩包 压缩解压处理模块)
常用函数组合(持续更新) ** shutil模块的常见函数列表 复制类 shutil.copy(src, dst):将文件src复制至dst.dst可以是个目录,会在该目录下创建与src同名的文件,若 ...
- Python 标准库 —— zipfile(读取 zip 文件)
Python模块学习:zipfile zip文件操作 Python 学习入门(16)-- zipfile 0. 解压 with zipfile.ZipFile('../data/jaychou_lyr ...
- python标准库之zipfile
python标准库zipfile 什么是zip文件?为何在网络上zip打包的文件比较常见?而不是rar? zip是一种压缩归档的文件,zip开源的. python的zipfile模块,有两个主要的类 ...
- 用于生成随机数的python标准库模块是_17 Python 标准库之 random 模块 - Python 进阶应用教程...
Python 标准库之 random 模块 随机数是随机产生的数,比如购买彩票,中奖的号码就是随机的.random 库是用于生成随机数的 Python 标准库,random 库提供如下函数: 函数 功 ...
- python第三方库排行-140种Python标准库、第三方库和外部工具
导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具. 这些库可用于文件读写.网络抓取和解析.数据连 ...
- 140种Python标准库、第三方库和外部工具都有了
导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具. 这些库可用于文件读写.网络抓取和解析.数据连 ...
- cassandra可视化工具_耗时1个月整理!160种Python标准库、第三方库和外部工具都有了...
耗时1个月整理!160种Python标准库.第三方库和外部工具都有了 北京尚学堂 2019-12-09 14:59:15 Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数 ...
- [转载] 140种Python标准库、第三方库和外部工具
参考链接: Python | 使用openpyxl在Excel文件中进行算术运算 这些库可用于文件读写.网络抓取和解析.数据连接.数清洗转换.数据计算和统计分析.图像和视频处理.音频处理.数据挖掘/机 ...
最新文章
- Ubuntu 14.04上使用CMake编译MXNet源码操作步骤(C++)
- 微型计算机硬件中访问速度最快的,习题一计算机基础知识.doc.doc
- 记录 之 一个小bug:Unsupported syntax ‘Starred‘
- jquery最快速入门文档
- Calendar是日历类
- google +按钮_如何禁用或改善Google的Google+集成
- 网络编程-关于get请求与post请求
- db2取数据库日期时间_DB2数据库取得当前时间的正确解析
- 由需求而产生的一款db导出excel的工具
- [JOYOI] 自然数拆分Lunatic版
- c语言不用switch做计算器,求助这个题目~不用switch语句用多重if 或者嵌套if的做法...
- 通讯录获取源码_[源码和文档分享]基于Java语言的C/S模式通讯录备份和查询软件...
- windows如何设定定时关机和取消定时
- 【安装记录】Centos7.6下载安装配置教程(十分详细)
- Deeping下docker简单使用
- UI——day15.H5和小程序的设计
- 计算机与打印机脱机后怎么共享,电脑重启后共享打印机脱机的解决方法
- 计算机组装拆卸 心得,学习组装电脑的心得体会怎么写?
- 图像拼接(八):拼接多幅图像+Matlab实现+Stanford Open Course
- windows微信多开
热门文章
- scrapy从入门到放弃 学习项目2
- 排序之插入排序:直接插入+希尔排序
- MySQL双主(主主)架构方案
- 20145233 20145228《信息安全系统设计基础》第二次实验报告
- 谓词NSPredicate的使用
- 去除img之间的空白
- 新开activity并且新旧窗口之间传值
- book: Effective Java
- “并发用户数”、“系统用户数”和“同时在线用户数”的计算公式
- 常用 API 函数(5): 文本和字体函数