费了九牛二虎之力搞到的python精选库,不看会后悔
【此文章转自乐字节】
现在Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多。而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开发都有涉及。
前端时间闲的无聊, 对Python兴趣徒增。学习这事儿吧,光看没用,还是要是实战,顺手搜了一些写的不错的开源库,也看了些博客。总结一些,分享给大家。
学Python,想必大家都是从爬虫开始的吧。毕竟网上类似的资源很丰富,开源项目也非常多。
简单来说这段过程发生了以下四个步骤:
查找域名对应的IP地址。
向IP对应的服务器发送请求。
服务器响应请求,发回网页内容。
浏览器解析网页内容。
有兴趣的朋友可以去网上搜索更详细的内容。
那么学习爬虫需要掌握哪些库呢?
通用:
- urllib -网络库(stdlib)。
- requests -网络库。
- grab – 网络库(基于pycurl)。
- pycurl – 网络库(绑定libcurl)。
- urllib3 – Python HTTP库,安全连接池、支持文件post、可用性高。
- httplib2 – 网络库。
- RoboBrowser – 一个简单的、极具Python风格的Python库,无需独立的浏览器即可浏览网页。
- MechanicalSoup -一个与网站自动交互Python库。
- mechanize -有状态、可编程的Web浏览库。
- socket – 底层网络接口(stdlib)。
- Unirest for Python – Unirest是一套可用于多种语言的轻量级的HTTP库。
- hyper – Python的HTTP/2客户端。
- PySocks – SocksiPy更新并积极维护的版本,包括错误修复和一些其他的特征。作为socket模块的直接替换。
文本处理
用于解析和操作简单文本的库。
- difflib – (Python标准库)帮助进行差异化比较。
- Levenshtein – 快速计算Levenshtein距离和字符串相似度。
- fuzzywuzzy – 模糊字符串匹配。
- esmre – 正则表达式加速器。
- ftfy – 自动整理Unicode文本,减少碎片化。
自然语言处理
处理人类语言问题的库。
- NLTK -编写Python程序来处理人类语言数据的最好平台。
- Pattern – Python的网络挖掘模块。他有自然语言处理工具,机器学习以及其它。
- TextBlob – 为深入自然语言处理任务提供了一致的API。是基于NLTK以及Pattern的巨人之肩上发展的。
- jieba – 中文分词工具。
- SnowNLP – 中文文本处理库。
- loso – 另一个中文分词库。
异步
异步网络编程库
- asyncio – (在Python 3.4 +版本以上的 Python标准库)异步I/O,时间循环,协同程序和任务。
- Twisted – 基于事件驱动的网络引擎框架。
- Tornado – 一个网络框架和异步网络库。
- pulsar – Python事件驱动的并发框架。
- diesel – Python的基于绿色事件的I/O框架。
- gevent – 一个使用greenlet 的基于协程的Python网络库。
- eventlet – 有WSGI支持的异步框架。
- Tomorrow – 异步代码的奇妙的修饰语法。
队列
- celery – 基于分布式消息传递的异步任务队列/作业队列。
- huey – 小型多线程任务队列。
- mrq – Mr. Queue – 使用redis & Gevent 的Python分布式工作任务队列。
- RQ – 基于Redis的轻量级任务队列管理器。
- simpleq – 一个简单的,可无限扩展,基于Amazon SQS的队列。
- python-gearman – Gearman的Python API。
电子邮件
用来发送和解析电子邮件的库。
- django-celery-ses:带有 AWS SES 和 Celery 的 Django email 后端。
- envelopes:供人类使用的电子邮件库。
- flanker:一个 email 地址和 Mime 解析库。
- imbox:Python IMAP 库。
- inbox.py:Python SMTP 服务器。
- inbox:一个开源电子邮件工具箱。
- lamson:Python 风格的 SMTP 应用服务器。
- mailjet:Mailjet API 实现,用来提供批量发送邮件,统计等功能。
- marrow.mailer:高性能可扩展邮件分发框架。
- modoboa:一个邮件托管和管理平台,具有现代的、简约的 Web UI。
- pyzmail:创建,发送和解析电子邮件。
- Talon:Mailgun 库,用来抽取信息和签名。
- yagmail:yagmail是一个GMAIL / SMTP客户端,旨在使其尽可能简单地发送电子邮件。
URL 处理
解析 URLs 的库
- furl:一个让处理 URL 更简单小型 Python 库。
- purl:一个简单的,不可变的 URL 类,具有简洁的 API 来进行询问和处理。
- pyshorteners:一个纯 Python URL 缩短库。
- shorturl:生成短小 URL 和类似 bit.ly 短链的 Python 实现。
- webargs:一个解析 HTTP 请求参数的库,内置对流行 web 框架的支持,包括 Flask, Django, Bottle, Tornado 和 Pyramid。
不看不知道,一看真的是吓一跳,Python的库真的太多太多了,有感兴趣的小伙伴可以去网上搜索更详细的内容。
Python有很多Web开发框架,大而全的开发框架非Django莫属,用得也最广泛.有很多公司有使用Django框架,如某狐,某讯等。以简洁著称的web.py,flask都非常易于上手,以异步高性能著称的tornado,源代码写得美如画,知乎,Quora都在用。
web开发的一些框架
1、Django
2、Flask
3、Web2py
4、Tornado
5、CherryPy
最后
祝大家学的愉快,学的神速。
有帮助的话,各位小伙伴可以点个赞收藏支持下啦!❤️
也欢迎关煮lili,一个在变秃,但能带你变强的程序员~
今天先说这么多,我是乐字节哩哩,一个有趣的灵魂!下期见!
最后给大家推荐三个b站超详细的Java和python自学课:
从java零基础到项目实战哦【b站BV: BV1CB4y1A7sk】
十大企业级项目自学课-B站:BV14K411F7HJ
python小白入门到精通完整版b站:BV1Sp4y1W77E
将bv号,复制去b站即可
费了九牛二虎之力搞到的python精选库,不看会后悔相关推荐
- 费了九牛二虎之力搞定女儿的户口
费了九牛二虎之力,终于办好了女儿的户口,终于落户广州市,下一步是将户口从广州调到深圳,之前办理女儿户口的时候将相关的资料都顺便给办了,后面应该比较顺利了. 这几年一直在外飘,我和老婆的户口在天南地北, ...
- 108个Python精选库,看完收获丰富
大家好,我是Python程序员 晚枫. Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器 ...
- 精心整理!最全的100个Python精选库,建议收藏!
来源:网络 Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云 ...
- Python精选库大全,建议收藏留用!
Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开 ...
- 整理了100个Python精选库,建议收藏!
来源:网络 Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云 ...
- 最全的100个Python精选库,建议收藏!
Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开 ...
- 整理了100个Python精选库,建议收藏
来源丨网络 Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云 ...
- Python 第三方库大全看这一篇就够了(1000+工具包)
awesome-python 是 vinta 发起维护的 Python 资源列表,内容包括:Web 框架.网络爬虫.网络内容提取.模板引擎.数据库.数据可视化.图片处理.文本处理.自然语言处理.机器学 ...
- 费了九牛二虎之力才搞出来的微信扫码授权openid绑定房间
开发公众号时,常常通过扫码绑定信息, 1.首先二维码中包含页面链接,列如注册,我这边写举一个简单的列子 上代码吧 @RequestMapping("/roomsinpage") p ...
最新文章
- 在用户控件中用户登录后台脚本判断
- MySQL 学习笔记 (它执行的步骤)
- mysql 没有mysql库_MySQL安装之后没有MySQL数据库的原因
- SSH Secure Shell显示GCC编译错误信息乱码解决方法
- java如何进行字符串拼接?
- 有没有五金产品展开计算机软件,花样算法猫腻不断 全屋定制这本账真心不好算...
- 应用HttpWebRequest接收post或get数据
- python学生管理系统(函数方法)_(python函数)学生管理系统
- 弹性地基梁板实用计算_建筑地基基础设计规范要点
- python易错盲点排查之+=与+的区别分析以及一些赋值运算踩过的坑
- python的数组怎么用_python数组的使用
- Charles接口模拟404/502
- synchdem matlab,数字高程模型(DEM)移动插值算法
- 图书馆图书上架_泉城书房济南市平阴县图书馆锦东分馆图书上架了!
- android 关闭jack_编译Android时禁用Jack Server
- 什么是BST?什么是哈希表?一文带你了解并实现查找的基础知识
- DevOps运维自动化工具系统平台
- 解决MySQL--发生系统错误 1069。 由于登录失败而无法启动服务。
- 密室逃脱(二)碧绿色房间
- Android 蓝牙源码学习笔记
热门文章
- 《Linux下使用Docker部署Web项目》
- Retrieval based on EI tree学习笔记
- qgis 空间连接_QGIS空间连接简介
- 内存、CPU、显存、GPU
- 复工后从简历被拒,到斩获蚂蚁offer,聊聊功不可没的公众号
- python 数据分析之 HTML文件解析
- 模糊搜索工具fzf的安装和使用
- linux ubuntu 安装git服务器,[linux] Ubuntu20.04上安装搭建私有Git服务器Gitea
- iOS架构模式(MVC/MVCS/MVP/MVVM/VIPER)
- 宿舍管理系统需求说明书