前言

机器学习的工作内容往往复杂枯燥又困难——通过大量重复工作进行提升必不可少:
汇总工作流及传输渠道、设置数据源以及在内部部署和云部署的资源之间来回分流。

所以使用工具提升你的工作效率实在很关键,而且像这样的工具越多越好。

好在你学的是Python,作为一门威力巨大的工具语言,Python可以给你提供足够的辅助工具,让你在大数据和机器学习项目中游刃有余。

唯一的问题在于Python海量的资源库让患有选择困难症的你难以取舍,因此糖豆贴心的给你找来了目前评价最高的五个Python库。

Python学习资料或者需要代码、视频加Python学习群:960410445

1. PyWren

项目地址:https://github.com/ericmjonas/pywren

PyWren项目

PyWren,简单而强大,用于进行基于Python的科学计算工作。

项目 At The New Stack 的简介这样描述 PyWren:

把 AWS Lambda 作为一个巨大的平行处理系统,以处理那些可被切割成诸多小任务的项目,同时还可以节约很多内存和硬盘空间。

Lambda 函数的一个缺点是运行时间最长不能超过 300 秒。

但是,如果你有一个只花费几分钟就能完成却需要在数据集中运行数千次的工作,那么 PyWren 也许是一个好选择,它可以在云端完成一种用户硬件上不可用的规模平行化的工作。

2. Tfdeploy

项目地址:https://github.com/riga/tfdeploy

Tfdeploy项目

如果你需要使用基于谷歌的 TensorFlow 框架的训练模型却不想使用框架本身的话,Tfdeploy可以帮你。

借由 Tfdeploy,可以在 Python 中使用模型,而且仅仅需要Numpy 的数学和统计库作为支撑。

几乎所有能在 TensorFlow 上跑的运行也能在 Tfdeploy 上跑,而且你可以通过标准 Python 隐喻方式来延伸库的行为(比如,超载一个类别)。

但是,Tf 部署并不支持 GPU 加速。

3.Luigi

项目地址:https://github.com/spotify/luigi

Luigi项目

编写成批作业通常只是处理海量数据的其中一步:你也不得不将所有这些工作串联起来,做成类似工作流程的东西。

Luigi 是 Spotify 打造的,用于解决所有通常与长期运行成批处理作业有关的管道问题。

有了 Luigi,研发人员就可以从事几个很难、与数据无关的任务处理——「 Hive 询问,在 Jave 上完成的 Hadoop 任务, Scala 上的 Spark 任务,从数据库中导出表格」——创造一个端到端运行它们的工作流。

对任务的整个描述以及依存性被打造为 Python 模块,和 XML 配置文档或其他数据形式不同,因此,可以被组合到其他以 Python 为中心的项目中去。

4.Kubelib

项目地址:https://github.com/safarijv/kubelib

Kubelib项目

如果你采用 Kubernetes 作为完成机器学习工作的编排系统(orchestration system),那你可能要小心的维护以免其自身运行的BUG比它能解决的问题都多。

Kubelib 为 Kubernetes 提供了一系列的 Python 接口,虽说需要 Jekins ing 作为支持,但没有 Jenkins 的情况下也能够使用。

它能够完成 暴露在 kubectl CLI 或者 Kubernetes API 中的所有事。

5.PyTorch

项目地址:https://github.com/pytorch/pytorch

PyTorch项目

最后一个成员还比较新,但却已经制造了足够大的声势:Python 库新成员 Pytorch,这一个Torch 机器学习框架工具。

PyTorch 不仅为 Torch 添加了 Python 端口,也增加了许多其他的便利,比如 GPU 加速,共享内存完成多重处理(multiprocessing,特别是多核上隔离开的工作。)

最大的亮点在于它们能为 Numpy 中的无加速功能提供 GPU 驱动的替代选择。

5个常用的机器学习python库相关推荐

  1. 机器学习 python 库_Python机器学习库

    机器学习 python 库 什么是机器学习? (What is Machine Learning?) As the web is immensely growing with each day, an ...

  2. 几行代码搞定ML模型,低代码机器学习Python库正式开源

    公众号关注 "视学算法" 设为 "星标",消息即可送达! 机器之心报道 机器之心编辑部 PyCaret 库支持在「低代码」环境中训练和部署有监督以及无监督的机器 ...

  3. python灰色模型代码_几行代码搞定ML模型,低代码机器学习Python库正式开源

    机器之心报道 机器之心编辑部 PyCaret 库支持在「低代码」环境中训练和部署有监督以及无监督的机器学习模型,提升机器学习实验的效率. 想提高机器学习实验的效率,把更多精力放在解决业务问题而不是写代 ...

  4. python低代码_几行代码搞定ML模型,低代码机器学习Python库正式开源

    PyCaret 库支持在「低代码」环境中训练和部署有监督以及无监督的机器学习模型,提升机器学习实验的效率. 想提高机器学习实验的效率,把更多精力放在解决业务问题而不是写代码上?低代码平台或许是个不错的 ...

  5. 代码实现tan graph model for classification_几行代码搞定ML模型,低代码机器学习Python库正式开源...

    PyCaret 库支持在「低代码」环境中训练和部署有监督以及无监督的机器学习模型,提升机器学习实验的效率. 想提高机器学习实验的效率,把更多精力放在解决业务问题而不是写代码上?低代码平台或许是个不错的 ...

  6. 厉害了!几行代码搞定ML模型,低代码机器学习Python库正式开源

    点击上方"Python高校",关注 文末干货立马到手 机器之心编辑部 PyCaret 库支持在「低代码」环境中训练和部署有监督以及无监督的机器学习模型,提升机器学习实验的效率. 想 ...

  7. 2019年最强大的十大机器学习python库

    导言 Python是最流行和广泛使用的编程语言之一,已经取代了业界的许多编程语言.以下是Python流行的几个重要原因: Python有大量的库. Python因其简单易懂而被称为初学者级编程语言. ...

  8. 机器学习 Python 库 Top 20

    如今开源是创新的核心,推动着技术的飞速革新.本文会为你介绍 2016 年机器学习 Top 20 Python 开源项目,同时分析得出一些有趣的见解和发展趋势. KDnuggets 为您带来 Githu ...

  9. 人生苦短-常用必备的Python库清单

    学Python,想必大家都是从爬虫开始的吧.毕竟网上类似的资源很丰富,开源项目也非常多. Python学习网络爬虫主要分3个大的版块:抓取,分析,存储 当我们在浏览器中输入一个url后回车,后台会发生 ...

最新文章

  1. iOS进阶之类别(Category)(9)
  2. 超实用的 Mybatis 3.5 新特性
  3. Struts2 校验数据问题
  4. 小白初学搭建 配置本地yum
  5. 机器学习中的数学知识(part2)
  6. jvm(3)-垃圾收集器与内存分配策略
  7. Java生产监控的阴暗面
  8. java 数组的拷贝 对象数组的拷贝 System.arraycopy函数
  9. Java学习笔记3——集合框架
  10. Leetoce--572. 另一个树的子树(java)
  11. 老男孩python课后作业_老男孩python基础知识练习题(一)中
  12. 统一返回对象和异常处理(一)
  13. web myeclipse为什么连接不上css_Web技巧 (03)
  14. windows下git ssh密钥生成
  15. 微信小程序实例教程(三)
  16. linux ps命令详细解读
  17. 软件测试工程师笔试题目
  18. 浏览器-Charset:Chrome浏览器升级后右键工具中的编码修改功能没有了的解决工具
  19. css定位(二)---css中粘性定位(sticky)---C3新增属性
  20. 项目管理知识体系九大知识领域简介

热门文章

  1. Docker之一:账号注册
  2. 基于JAVA的摄影网站的设计与实现
  3. Java自定义类数组的创建和使用
  4. 深度学习 通俗理解——非常适合新手
  5. 领导干部自然资源资产离任审计吹牛速成
  6. python如何另存文件_python如何保存文本文件
  7. 带动画的欢迎界面的实现
  8. ubuntu 配置android环境,Ubuntu Linux下如何配置Android开发环境
  9. Linux 编译安装Nginx
  10. php 做订餐系统,做个订餐系统,需要的工作量有多大?