开发四年只会写业务代码,分布式高并发都不会还做程序员?  

近日,来自 Databricks 的 Matei Zaharia 宣布推出开源机器学习平台 MLflow 。Matei Zaharia 是 Apache Spark 和 Apache Mesos 的核心作者,也是 Databrick 的首席技术专家。Databrick 是由 Apache Spark 技术团队所创立的商业化公司。MLflow 目前已处于早期测试阶段,开发者可下载源码体验。

Matei Zaharia 表示当前在使用机器学习的公司普遍存在工具过多、难以跟踪实验、难以重现结果、难以部署等问题。为让机器学习开发变得与传统软件开发一样强大、可预测和普及,许多企业已开始构建内部机器学习平台来管理 ML生命周期。像是 Facebook、Google 和 Uber 就已分别构建了 FBLearner Flow、TFX 和 Michelangelo 来管理数据、模型培训和部署。不过由于这些内部平台存在局限性和绑定性,无法很好地与社区共享成果,其他用户也无法轻易使用。

MLflow 正是受现有的 ML 平台启发,主打开放性:

  • 开放接口:可与任意 ML 库、算法、部署工具或编程语言一起使用。

  • 开源:开发者可轻松地对其进行扩展,并跨组织共享工作流步骤和模型。

MLflow 目前的 alpha 版本包含三个组件:

其中,MLflow Tracking(跟踪组件)提供了一组 API 和用户界面,用于在运行机器学习代码时记录和查询参数、代码版本、指标和输出文件,以便以后可视化它们。

import mlflow# Log parameters (key-value pairs)
mlflow.log_param("num_dimensions", 8)
mlflow.log_param("regularization", 0.1)# Log a metric; metrics can be updated throughout the run
mlflow.log_metric("accuracy", 0.1)
...
mlflow.log_metric("accuracy", 0.45)# Log artifacts (output files)
mlflow.log_artifact("roc.png")
mlflow.log_artifact("model.pkl")

MLflow Projects(项目组件)提供了打包可重用数据科学代码的标准格式。每个项目都只是一个包含代码或 Git 存储库的目录,并使用一个描述符文件来指定它的依赖关系以及如何运行代码。每个 MLflow 项目都是由一个简单的名为 MLproject 的 YAML 文件进行自定义。

name: My Project
conda_env: conda.yaml
entry_points:main:parameters:data_file: pathregularization: {type: float, default: 0.1}command: "python train.py -r {regularization} {data_file}"validate:parameters:data_file: pathcommand: "python validate.py {data_file}"

MLflow Models(模型组件)提供了一种用多种格式打包机器学习模型的规范,这些格式被称为 “flavor” 。MLflow 提供了多种工具来部署不同 flavor 的模型。每个 MLflow 模型被保存成一个目录,目录中包含了任意模型文件和一个 MLmodel 描述符文件,文件中列出了相应的 flavor 。

time_created: 2018-02-21T13:21:34.12
flavors:sklearn:sklearn_version: 0.19.1pickled_model: model.pklpython_function:loader_module: mlflow.sklearnpickled_model: model.pkl

Apache Spark 技术团队开源机器学习平台 MLflow相关推荐

  1. IBM也要开源机器学习平台

    这下齐了,IBM也要开源机器学习平台了 2015-11-23 21:18 原创 金红 12条评论 人工智能是机器人的核心,是机器人的大脑.想要制造一个大脑不是一件容易的事,所以很多机器人公司都在等着, ...

  2. Spark团队开源新项目MLflow发布0.2版本,内置TensorFlow集成

    译者 | 无明 编辑 | Natalie AI 前线导读: 在今年的 Spark+AI 峰会上,Spark 团队推出了 MLflow,一个开源的用于简化机器学习生命周期的平台.从首次发布到现在的三周时 ...

  3. Apache Spark 2.0: 机器学习模型持久化

    在即将发布的Apache Spark 2.0中将会提供机器学习模型持久化能力.机器学习模型持久化(机器学习模型的保存和加载)使得以下三类机器学习场景变得容易: 数据科学家开发ML模型并移交给工程师团队 ...

  4. cube 一站式云原生开源机器学习平台

    https://github.com/tencentmusic/cube-studio cube云原生机器学习平台-架构(一) cube云原生机器学习平台-架构(二) cube云原生机器学习平台-架构 ...

  5. Apache Spark技术实战之6 -- spark-submit常见问题及其解决

    除本人同意外,严禁一切转载,徽沪一郎. 概要 编写了独立运行的Spark Application之后,需要将其提交到Spark Cluster中运行,一般会采用spark-submit来进行应用的提交 ...

  6. 百分点大数据技术团队:舆情平台架构实践与演进

    编者按 现代社会每天都有大量信息产生,抖音.小红书等自媒体的普及,不断丰富着人们表达看法.传播诉求.分享信息的渠道和形式.如何完成多源异构数据的收集和处理,挖掘海量信息中的价值,洞察事件背后的观点和情 ...

  7. 【机器学习 Alink开源】10分钟了解下阿里开源机器学习平台alink

    1.什么是Alink? Alink 是阿里巴巴计算平台事业部PAI团队从 2017 年开始基于实时计算引擎 Flink 研发的新一代机器学习算法平台,提供丰富的算法组件库和便捷的操作框架,开发者可以一 ...

  8. DeepMind星际争霸2开源机器学习平台

    DeepMind 之前开源了<星际争霸2>的深度强化学习平台,这是个很好的训练环境,学起来也很有趣.下面是一份有关设置环境和训练模型的教程,基于Mac环境.我们会跑一遍训练脚本,使用Dee ...

  9. 各个大厂的机器学习平台概述

    机器学习的核心是"使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测".这意味着,与其显式地编写程序来执行某些任务,不如教计算机如何开发一个算法来完成任务.有三种主要 ...

最新文章

  1. 硬件平台上深度学习自动内核优化
  2. 卫星覆盖分析传感器类型
  3. Java HashMap遍历的两种方式
  4. SQL Server 2008 阻止保存要求重新创建表的更改问题的设置方法
  5. componentsJoinedByString 和 componentsSeparatedByString 的方法的区别
  6. .NET Core也可以使用MongoDB了
  7. 证书是用来改善与增强,而不是代替? --如何让钱主动来找你?
  8. MIUI Android p手势,小米8 Android P内测9月开启
  9. 安装Windows Server 2008 R2 Cluster
  10. 正确使用ArrayList和LinkedList
  11. 使用Microsoft Lookback网卡解决了断网情况下 Virtual Server 虚机和主机的网络连接
  12. 2019swpuj2ee作业3
  13. sklearn svm 调参_用 Grid Search 对 SVM 进行调参
  14. php 微信公众号客服,微信公众平台开发多客服
  15. java 获取当前时间所在自然周起止时间及自然周中的每一天
  16. NMAP扫描基本操作
  17. 心血来潮,开通了博客
  18. 关于浏览器主页被劫持
  19. 任务态fMRI测量的重测可靠性:新的实证证据和元分析
  20. uidesigner android控件库,uidesigner(腾讯内部软件原型设计利器UI设计软件)v2.5.5.1官方版-独木成林...

热门文章

  1. 开源 java CMS - FreeCMS2.8 数据对象 applyopen
  2. 劫持选举 EOJ 3535(随机)
  3. 【290】Python 函数
  4. 教你写一个可以找到.m文件所有接口名的命令行工具
  5. VS2013的项目转到VS2010需要修改的
  6. [AS3 3D Demo] Stage3D学习过程中开发的3个Demo
  7. jQuery 中 jQuery(function(){})与(function(){})(jQuery) 的区别
  8. Javascript异步编程的4种方法
  9. UISearchbar placeholder 文本和icon居左 iOS7
  10. 未授权用户在此计算机上的的请求登陆类型