这些 Python 库帮助你加速数据传输,通过 AWS Lambda 对大型计算工作做碎片化处理,并使用略低于 TensorFlow 的模型工作。

机器学习令人兴奋,但具体工作复杂而困难。通常它涉及很多手动提升——汇总工作流及传输渠道,设置数据源,以及在内部部署和云部署的资源之间来回分流。

用来提高工作效率的手头工具越多越好。庆幸的是,Python 是一个威力巨大的工具语言,在大数据和机器学习之中被广泛使用。下面是 5 个 Python 库,帮助你缓解来自交易提升的重负。

PyWren

地址:https://github.com/ericmjonas/pywren

PyWren,一个带有强大前提的简单包,能使你运行基于 Python 的科学计算工作量,以作为 AWS Lambda 函数的多个例子。项目 At The New Stack 的简介这样描述 PyWren: 把 AWS Lambda 用作一个巨大的平行处理系统,以处理那些可被切割成诸多小任务的项目,这些小任务的运行不需要占用很多内存或硬盘。

Lambda 函数的一个缺点是运行时间最长不能超过 300 秒。但是,如果你需要一个只花费几分钟就能完成的工作,并在数据集中需要运行数千次,那么 PyWren 也许是一个好选择,它可以一种用户硬件上不可用的规模平行化云端的工作。

谷歌的 TensorFlow 框架正迈入伟大时刻,因为刚发布了 1.0。人们通常会问一个问题:如何利用在上面训练的模型而无需使用 TensorFlow 本身?

Tfdeploy

地址:https://github.com/riga/tfdeploy

Tfdeploy 可以部分解决这个问题。将训练过的 TensorFlow 模型输出「一个简单的基于 Numpy 的可调用对象(callable)」,也就是说,借由 Tfdeploy,可以在 Python 中使用模型,而且 Numpy 的数学和统计库被作为唯一的依靠。几乎所有能在 TensorFlow 上跑的运行也能在 Tfdeploy 上跑,而且你可以通过标准 Python 隐喻方式来延伸库的行为(比如,超载一个类别)。

现在,坏的消息是:Tf 部署并不支持 GPU 加速,要是 Numpy 能克服那一点该多好。Tfdeploy 的创造者建议 gNumPy 项目是一个可行的替代。

Luigi

地址:https://github.com/spotify/luigi

编写成批作业通常只是处理海量数据的其中一步:你也不得不将所有这些工作串联起来,做成类似工作流程的东西。Luigi 是 Spotify 打造的,用于「解决所有通常与长期运行成批处理作业有关的管道问题。」

有了 Luigi,研发人员就可以从事几个很难、与数据无关的任务处理——「一个 Hive 询问,一个在 Jave 上完成的 Hadoop 任务,一个 Scala 上的 Spark 任务,一个从数据库中导出表格」——创造一个端到端运行它们的工作流。对任务的整个描述以及依存性被打造为 Python 模块,和 XML 配置文档或其他数据形式不同,因此,可以被组合到其他以 Python 为中心的项目中去。

Kubelib

地址:https://github.com/safarijv/kubelib

如果你采用 Kubernetes 作为完成机器学习工作的编排系统(orchestration system),你最不想要的就是它产生的问题比能解决的问题都多。Kubelib 为 Kubernetes 提供了一系列的 Python 接口,本来是用 Jekins scripting 作为帮助。但没有 Jenkins 的情况下也能够使用,它能够完成 暴露在 kubectl CLI 或者 Kubernetes API 中的所有事。

地址:https://github.com/pytorch/pytorch

不要忘记了最近发布的、引人注目的 Python 库新成员 Pytorch,这是 Torch 机器学习框架的一个工具。PyTorch 不仅为 Torch 添加了 Python 端口,也增加了许多其他的便利,比如 GPU 加速,共享内存完成多重处理(multiprocessing,特别是多核上隔离开的工作。) 最好的是,它们能为 Numpy 中的无加速功能提供 GPU 驱动的替代选择。

原文链接:http://www.infoworld.com/article/3171654/artificial-intelligence/5-python-libraries-to-lighten-your-machine-learning-load.html

python最好的五个库_5 个Python 库,照亮你的机器学习之路相关推荐

  1. 老滚5初始化python失败_五分钟学会怎么用python做一个简单的贪吃蛇

    Pygame 是一组用来开发游戏软件的 Python 程序模块,基于 SDL 库的基础上开发.我们今天将利用它来制作一款大家基本都玩过的小游戏--贪吃蛇. 一.需要导入的包 import pygame ...

  2. python三维数据转换成二维_5大Python可视化库到底选哪个好?一篇文章搞定从选库到教学...

    最近和鲸社区的大佬们,竟不约而同地写起了可视化库的教程,开始了掰头 ※完整教程列表在文末附录 虽然对于我们这种吃瓜群众来说是件好事,但 大概大佬的快乐往往就是那么的朴实无华且枯燥吧.害,管他呢,赶紧拿 ...

  3. python 小程序搜索排名优化_5个Python脚本优化你的网站搜索引擎优化

    寻找改善你的Python网站的搜索引擎优化?然后,您需要查看这五个脚本,这些脚本可以帮助您的网站在网络上可见! Python不仅是一种惊人的编程语言,它在开发搜索引擎优化工具时也非常有用.在本文中,我 ...

  4. 零基础该如何系统地自学Python编程?五个阶段带你从小白到大佬

    对于零基础学习或是已经学完基础不知道下一步该干什么的朋友,可以看看这篇缓解迷茫.今天分享下如何系统地自学Python规划目标,有一个学习目标在去行动. 有了目标,怎么行动呢?建议采用视频+书籍的方式进 ...

  5. python免费教学视频400集-如何入门 Python 爬虫?400集免费教程视频带你从0-1全面掌握...

    学习Python大致可以分为以下几个阶段: 1.刚上手的时候肯定是先过一遍Python最基本的知识,比如说:变量.数据结构.语法等,基础过的很快,基本上1~2周时间就能过完了,我当时是在这儿看的基础: ...

  6. 【Python】推荐五个常用的图像处理库

    1. 引言 Python目前是世界上使用最多的编程语言之一.它能够以更少的工作量和更少的代码行数来完成许多事情.它还可以使用很少的代码行来方便地编辑和创建图像. 本文重点介绍,在图像处理领域,我们最常 ...

  7. python有趣的5个库_彩蛋有趣的五个_你知道 Python 这五个有趣的彩蛋吗?-云栖社区-阿里云...

    当一门编程语言是开源的时候,往往会有产生一些搞笑和有趣的东西.通常,这意味着社区的贡献者会为该语言添加一些有趣和特别的彩蛋以及隐藏的特性(当然前提是不会增加在生产环境中使用的风险). Python 就 ...

  8. Python培训教程分享:“高效实用” 的Python工具库

    作为一名合格Python技术员,对于Python工具库的使用是少不了的,本期Python培训教程就为大家分享的是""高效实用" 的Python工具库",希望能够 ...

  9. 集五福,我用Python

    所有参与投票的 CSDN 用户都参加抽奖活动 群内公布奖项,还有更多福利赠送 作者 | Crossin先生 编辑 | Jane 来源 | Crossin的编程教室(ID:crossincode) [导 ...

最新文章

  1. CNN回应中方谴责 否认冒犯中国人
  2. java 无法找到ant_无法找到与ANT(mac)关联的文件
  3. mysql 并发避免锁表_MYSQL锁表的用法,防止并发情况下的重复数据
  4. python线性表顺序存储实现_数据结构——基于C的线性表的顺序存储结构的基本操作的实现...
  5. 中国旅游日出游火爆 中国第一水乡游人突破5万
  6. 环美亚二十年装修师傅分享,甲醛的八种来源
  7. mysql java驱动 ibm_JDBC驱动汇总
  8. 【JAVA SE】第十五章 ArrayList、LinkedList、HashMap和HashSet
  9. SpringCloud Config 本地配置
  10. 【已解决】python远程连接数据库问题
  11. linux设备驱动——字符设备驱动
  12. 第四章 MyBatis缓存和注解的使用
  13. matplotlib设置x轴和y轴 设置
  14. 全网的 IP 归属地显示,带你5分钟加上,就是这么简单
  15. 纯javascript模拟操作系统---jsOS
  16. 报Keystore was tampered with, or password was incorret的原因
  17. 一键获取网页中的全部图片并批量下载(国内淘宝天猫京东网站+国外商品页面)——亲测有效
  18. 【DB笔试面试733】在Oracle中,RAC中REMOTE_LISTENER的作用是什么?
  19. 10bit为什么比8bit节省带宽
  20. TCP/IP前端面试

热门文章

  1. master slave mysql_MYSQL高可用之复制(MASTER/SLAVE)
  2. socket连接时间太长受什么原因影响?_晶振不起振的原因和应对措施
  3. 【剑指Offer】60、把二叉树打印成多行
  4. 一种使用SOC精确控制脉冲的方法
  5. 迅捷路由器FW325R的无线桥接
  6. Restful规范-开发api接口
  7. Node.js基础学习(第二幕)
  8. [iOS-UI]点击清空按钮,却会有提交的感觉
  9. 算法竞赛入门经典训练指南
  10. 编程之美:寻找发帖水王 扩展