微软开源了MMLSpark,用于用于Apache Spark的的深度学习库。MMLSpark可以与微软认知工具包和OpenCV完美整合。

微软发现,虽然SparkML可以建立可扩展的机器学习平台,绝大多数开发者的精力都耗在了调用底层API上。MMLSpark旨在简化PySpark中的重复性工作。

以UCI的成人收入普查数据集举例,使用其他项目预测收入:

如果直接使用SparkML,每一列都需要单独处理,整理为正确的数据类型;在MMLSpark中只需要两行代码:

model = mmlspark.TrainClassifier(model=LogisticRegression(), labelCol=” income”).fit(trainData)

predictions = model.transform(testData)

深度神经网络(DNN)在图像识别和语音识别等领域不逊于人类,但是DNN模型的训练需要专业人员方可进行,与SparkML的整合也十分不易。MMLSpark提供了方便的Python API,可以方便地训练DNN算法。MMLSpark可以方便地使用现有模型进行分类任务、在分布式GPU节点上进行训练、以及使用OpenCV建立可扩展的图像处理管线。

以下3行代码可以从微软认知工具集中初始化一个DNN模型,从图像中抽取特征:

cntkModel = CNTKModel().setInputCol(“images”).setOutputCol(“features”).setModelLocation(resnetModel).setOutputNode(“z.x”)

featurizedImages = cntkModel.transform(imagesWithLabels).select([‘labels’,’features’])

model = TrainClassifier(model=LogisticRegression(),labelCol=”labels”).fit(featurizedImages)

MMLSpark已经发布到Docker Hub上,使用下面的命令即可在单机部署:

docker run -it -p 8888:8888 -e ACCEPT_EULA=yes microsoft/mmlspark

MMLSpark使用MIT协议授权。

查看英文原文:

linux命令 mml,微软开源用于Spark的深度学习库MMLSpark相关推荐

  1. 微软开源人工智能工具和深度学习框架

    微软机器视觉.语音处理.视频检索人工智能开源工具和深度学习框架. 本文介绍了微软在人工智能领域的领先成果.产品线,开源人工智能框架和工具.读者可以运用这些工具快速开发机器视觉.语音处理.视频检索等丰富 ...

  2. 《Linux命令行大全》重点笔记——第一部分 学习shell

    <Linux命令行大全>重点笔记 第一部分 学习shell 第一章 shell是什么 1.3 简单命令 1.date:系统时间.日期. 2.cal:当月日历. 3.df:磁盘可用空间. 4 ...

  3. 未能加载程序集或它的一个依赖项_英伟达发布kaolin:一个用于加速3D深度学习研究的PyTorch库...

    由于大多数现实环境是三维的,因此理想情况下,应针对3D数据训练旨在分析视频或现实环境中的完整任务的深度学习模型.诸如机器人,自动驾驶汽车,智能手机和其他设备之类的技术工具目前正在产生越来越多的3-D数 ...

  4. 亚马逊深度学习库_汽车Linux,8位社交,与Amazon的深度学习以及更多新闻

    亚马逊深度学习库 在本周的开源新闻摘要中,我们将介绍汽车Linux,社交8位,具有神经网络的深度学习等等! 2016年5月7日至14日的开源新闻摘要 汽车用Linux等于大型汽车制造商的快速创新 Li ...

  5. PCANet --- 用于图像分类的深度学习基准

    PCANet --- 用于图像分类的深度学习基准 from: http://m.oschina.net/blog/275922 Ldpe2G 发布于 2年前,共有 37 条评论 前言 论文网站:htt ...

  6. 微软亚马逊联手发布深度学习库Gluon,适合所有段位的炼丹师

    安妮 编译整理 量子位 出品 | 公众号 QbitAI 昨天,亚马逊AWS和微软共同宣布推出深度学习库Gluon.Gluon为各种水平的深度学习开发人员设计,帮助炼丹师们在云端.App和其他设备上设计 ...

  7. linux cmd 字体,微软开源Cascadia Code新字体,该字体针对命令行和代码编辑器

    本周微软不仅开源了他们的C++标准库(STL),而且他们现在也开源了Cascadia Code的新字体. Cascadia Code主要针对开发人员,专门针对命令行应用程序和代码编辑器进行了优化.微软 ...

  8. 微软开源用于大规模查找并修复漏洞的开发者工具 Project OneFuzz 框架

     聚焦源代码安全,网罗国内外最新资讯! 编译:奇安信代码卫士团队 近日,微软发布公告宣布开源用于大规模查找并修复漏洞的自动化工具 OneFuzz 框架.如下为全文: 微软致力于和社区以及客户一起持续改 ...

  9. 【2018深信服 醒狮计划】《Linux命令行与Shell脚本编程大全》学习笔记

    2018深信服"醒狮计划"笔记 第3周(5.02-5.13) 课程 必修 选修 基本要求 Shell编程 <Linux命令行与Shell脚本编程大全> <Perl ...

  10. Facebook又放大招!开源框架Pythia让深度学习更高效

    https://www.toutiao.com/a6693693085001449995/ 2019-05-22 11:47:49 [新智元导读]Facebook的人工智能研究部门近期推出Pythia ...

最新文章

  1. 华为手机设置代理网络就无法使用_华为手机一定要了解的7个设置!1秒开启使用,实在太强大了...
  2. Wireshark数据抓包教程之Wireshark捕获数据
  3. 创建linux启动盘,linux系统中如何创建windows启动盘的详细介绍
  4. ACCESS的System.Data.OleDb.OleDbException: INSERT INTO 语句的语法错误
  5. 实现ls -l功能 和目录实现
  6. 谷歌/微软/必应web页面免费翻译插件
  7. 斗鱼mac html5,斗鱼直播伴侣ios苹果版使用教程_苹果版斗鱼直播伴侣怎么用_3DM手游...
  8. 剑网三手游哪个服务器人多稳定,“剑网三”手游开服后,我听了半个小时的骂街...
  9. 射频中的回波损耗,反射系数,电压驻波比以及S参数的含义和关系
  10. voc2012 测试数据集 上传
  11. 常州2021高考成绩查询,2021年常州高考各高中成绩及本科升学率数据排名及分析...
  12. 从Anker到SHEIN,对不起我要放弃Amazon了
  13. web安全从基础术语、windows/linux基础到安全漏洞/病毒木马挖掘与分析利用(持续更新)
  14. “交通·未来”第17期:深度出行感知,从出行需求预测到出行目的地预测
  15. aabbcc本质不同的排列数
  16. 来自Bitly的USA.gov数据
  17. 巨推荐!文献下载利器!6个网站可随时随地免费下载中文文献!
  18. java切换svn用户_SVN如何切换账号
  19. java 从已知日期计算干支纪日_干支纪日-干支纪日是如何计算的如何确定某一天的干支顺序? 爱问知识人...
  20. 【python】绘制内切圆

热门文章

  1. linux中 kill USR1和USR2 的区别
  2. linux桌面网络连接是个X,Xbrowser如何运行多个X桌面
  3. Codeforces ~ 1009C ~ Annoying Present (贪心)
  4. QNX 7.1 交叉编译 boost 1.76
  5. 添加遮罩css,添加遮罩层
  6. 你还把游戏本地化当作是游戏翻译
  7. Http格林尼治时间和毫秒的相互转化EEE, dd MMM y HH:mm:ss 'GMT'
  8. Java解析多种文件输出字符串以及图片(ppt、odc、odcx、pptx、xls、xlsx、rtf)
  9. BZOJ 3262: 陌上花开 (CDQ分治)
  10. 面向对象:上得厅堂,下得厨房,站起来杀猪,坐下来写书