【此文章转自乐字节】

现在Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多。而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开发都有涉及。

前端时间闲的无聊, 对Python兴趣徒增。学习这事儿吧,光看没用,还是要是实战,顺手搜了一些写的不错的开源库,也看了些博客。总结一些,分享给大家。

学Python,想必大家都是从爬虫开始的吧。毕竟网上类似的资源很丰富,开源项目也非常多。

简单来说这段过程发生了以下四个步骤:

  • 查找域名对应的IP地址。

  • 向IP对应的服务器发送请求。

  • 服务器响应请求,发回网页内容。

  • 浏览器解析网页内容。

    有兴趣的朋友可以去网上搜索更详细的内容。

那么学习爬虫需要掌握哪些库呢?

通用:

  1. urllib -网络库(stdlib)。
  2. requests -网络库。
  3. grab – 网络库(基于pycurl)。
  4. pycurl – 网络库(绑定libcurl)。
  5. urllib3 – Python HTTP库,安全连接池、支持文件post、可用性高。
  6. httplib2 – 网络库。
  7. RoboBrowser – 一个简单的、极具Python风格的Python库,无需独立的浏览器即可浏览网页。
  8. MechanicalSoup -一个与网站自动交互Python库。
  9. mechanize -有状态、可编程的Web浏览库。
  10. socket – 底层网络接口(stdlib)。
  11. Unirest for Python – Unirest是一套可用于多种语言的轻量级的HTTP库。
  12. hyper – Python的HTTP/2客户端。
  13. PySocks – SocksiPy更新并积极维护的版本,包括错误修复和一些其他的特征。作为socket模块的直接替换。

文本处理

用于解析和操作简单文本的库。

  • difflib – (Python标准库)帮助进行差异化比较。
  • Levenshtein – 快速计算Levenshtein距离和字符串相似度。
  • fuzzywuzzy – 模糊字符串匹配。
  • esmre – 正则表达式加速器。
  • ftfy – 自动整理Unicode文本,减少碎片化。

自然语言处理

处理人类语言问题的库。

  • NLTK -编写Python程序来处理人类语言数据的最好平台。
  • Pattern – Python的网络挖掘模块。他有自然语言处理工具,机器学习以及其它。
  • TextBlob – 为深入自然语言处理任务提供了一致的API。是基于NLTK以及Pattern的巨人之肩上发展的。
  • jieba – 中文分词工具。
  • SnowNLP – 中文文本处理库。
  • loso – 另一个中文分词库。

异步

异步网络编程库

  • asyncio – (在Python 3.4 +版本以上的 Python标准库)异步I/O,时间循环,协同程序和任务。
  • Twisted – 基于事件驱动的网络引擎框架。
  • Tornado – 一个网络框架和异步网络库。
  • pulsar – Python事件驱动的并发框架。
  • diesel – Python的基于绿色事件的I/O框架。
  • gevent – 一个使用greenlet 的基于协程的Python网络库。
  • eventlet – 有WSGI支持的异步框架。
  • Tomorrow – 异步代码的奇妙的修饰语法。

队列

  • celery – 基于分布式消息传递的异步任务队列/作业队列。
  • huey – 小型多线程任务队列。
  • mrq – Mr. Queue – 使用redis & Gevent 的Python分布式工作任务队列。
  • RQ – 基于Redis的轻量级任务队列管理器。
  • simpleq – 一个简单的,可无限扩展,基于Amazon SQS的队列。
  • python-gearman – Gearman的Python API。

电子邮件

用来发送和解析电子邮件的库。

  • django-celery-ses:带有 AWS SES 和 Celery 的 Django email 后端。
  • envelopes:供人类使用的电子邮件库。
  • flanker:一个 email 地址和 Mime 解析库。
  • imbox:Python IMAP 库。
  • inbox.py:Python SMTP 服务器。
  • inbox:一个开源电子邮件工具箱。
  • lamson:Python 风格的 SMTP 应用服务器。
  • mailjet:Mailjet API 实现,用来提供批量发送邮件,统计等功能。
  • marrow.mailer:高性能可扩展邮件分发框架。
  • modoboa:一个邮件托管和管理平台,具有现代的、简约的 Web UI。
  • pyzmail:创建,发送和解析电子邮件。
  • Talon:Mailgun 库,用来抽取信息和签名。
  • yagmail:yagmail是一个GMAIL / SMTP客户端,旨在使其尽可能简单地发送电子邮件。

URL 处理

解析 URLs 的库

  • furl:一个让处理 URL 更简单小型 Python 库。
  • purl:一个简单的,不可变的 URL 类,具有简洁的 API 来进行询问和处理。
  • pyshorteners:一个纯 Python URL 缩短库。
  • shorturl:生成短小 URL 和类似 bit.ly 短链的 Python 实现。
  • webargs:一个解析 HTTP 请求参数的库,内置对流行 web 框架的支持,包括 Flask, Django, Bottle, Tornado 和 Pyramid。

不看不知道,一看真的是吓一跳,Python的库真的太多太多了,有感兴趣的小伙伴可以去网上搜索更详细的内容。

Python有很多Web开发框架,大而全的开发框架非Django莫属,用得也最广泛.有很多公司有使用Django框架,如某狐,某讯等。以简洁著称的web.py,flask都非常易于上手,以异步高性能著称的tornado,源代码写得美如画,知乎,Quora都在用。

web开发的一些框架

1、Django

2、Flask

3、Web2py

4、Tornado

5、CherryPy

最后
祝大家学的愉快,学的神速。
有帮助的话,各位小伙伴可以点个赞收藏支持下啦!❤️
也欢迎关煮lili,一个在变秃,但能带你变强的程序员~
今天先说这么多,我是乐字节哩哩,一个有趣的灵魂!下期见!

最后给大家推荐三个b站超详细的Java和python自学课:

从java零基础到项目实战哦【b站BV: BV1CB4y1A7sk】

十大企业级项目自学课-B站:BV14K411F7HJ

python小白入门到精通完整版b站:BV1Sp4y1W77E

将bv号,复制去b站即可

费了九牛二虎之力搞到的python精选库,不看会后悔相关推荐

  1. 费了九牛二虎之力搞定女儿的户口

    费了九牛二虎之力,终于办好了女儿的户口,终于落户广州市,下一步是将户口从广州调到深圳,之前办理女儿户口的时候将相关的资料都顺便给办了,后面应该比较顺利了. 这几年一直在外飘,我和老婆的户口在天南地北, ...

  2. 108个Python精选库,看完收获丰富

    大家好,我是Python程序员 晚枫. Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器 ...

  3. 精心整理!最全的100个Python精选库,建议收藏!

    来源:网络 Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云 ...

  4. Python精选库大全,建议收藏留用!

    Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开 ...

  5. 整理了100个Python精选库,建议收藏!

    来源:网络 Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云 ...

  6. 最全的100个Python精选库,建议收藏!

    Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开 ...

  7. 整理了100个Python精选库,建议收藏

    来源丨网络 Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云 ...

  8. Python 第三方库大全看这一篇就够了(1000+工具包)

    awesome-python 是 vinta 发起维护的 Python 资源列表,内容包括:Web 框架.网络爬虫.网络内容提取.模板引擎.数据库.数据可视化.图片处理.文本处理.自然语言处理.机器学 ...

  9. 费了九牛二虎之力才搞出来的微信扫码授权openid绑定房间

    开发公众号时,常常通过扫码绑定信息, 1.首先二维码中包含页面链接,列如注册,我这边写举一个简单的列子 上代码吧 @RequestMapping("/roomsinpage") p ...

最新文章

  1. 在用户控件中用户登录后台脚本判断
  2. MySQL 学习笔记 (它执行的步骤)
  3. mysql 没有mysql库_MySQL安装之后没有MySQL数据库的原因
  4. SSH Secure Shell显示GCC编译错误信息乱码解决方法
  5. java如何进行字符串拼接?
  6. 有没有五金产品展开计算机软件,花样算法猫腻不断 全屋定制这本账真心不好算...
  7. 应用HttpWebRequest接收post或get数据
  8. python学生管理系统(函数方法)_(python函数)学生管理系统
  9. 弹性地基梁板实用计算_建筑地基基础设计规范要点
  10. python易错盲点排查之+=与+的区别分析以及一些赋值运算踩过的坑
  11. python的数组怎么用_python数组的使用
  12. Charles接口模拟404/502
  13. synchdem matlab,数字高程模型(DEM)移动插值算法
  14. 图书馆图书上架_泉城书房济南市平阴县图书馆锦东分馆图书上架了!
  15. android 关闭jack_编译Android时禁用Jack Server
  16. 什么是BST?什么是哈希表?一文带你了解并实现查找的基础知识
  17. DevOps运维自动化工具系统平台
  18. 解决MySQL--发生系统错误 1069。 由于登录失败而无法启动服务。
  19. 密室逃脱(二)碧绿色房间
  20. Android 蓝牙源码学习笔记

热门文章

  1. 《Linux下使用Docker部署Web项目》
  2. Retrieval based on EI tree学习笔记
  3. qgis 空间连接_QGIS空间连接简介
  4. 内存、CPU、显存、GPU
  5. 复工后从简历被拒,到斩获蚂蚁offer,聊聊功不可没的公众号
  6. python 数据分析之 HTML文件解析
  7. 模糊搜索工具fzf的安装和使用
  8. linux ubuntu 安装git服务器,[linux] Ubuntu20.04上安装搭建私有Git服务器Gitea
  9. iOS架构模式(MVC/MVCS/MVP/MVVM/VIPER)
  10. 宿舍管理系统需求说明书