学习笔记,仅供参考,有错必纠


文章目录

  • 机器学习平台PAI
    • 机器学习PAI
    • PAI的使用流程
      • PAI的数据建模
      • PAI三种建模方式
      • PAI的在线预测、离线调度

机器学习平台PAI

机器学习PAI

**阿里云机器学习平台PAI( Platform of Artificial Intelligence ):**是构建在阿里云MaxCompute计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。为算法开发者提供了丰富的MPI、PS、BSP等编程框架和数据存储接口,同时提供了基于WEB的可视化控制台,降低了使用门槛。PAI上手简单、算法丰富、一站式体验并支持深度学习。

PAI跟DataWorks是无缝打通的,实现SQL、UDF、UDAF、MR等多种数据处理,基于PAI平台上训练模型,生成的模型可以通过EAS部署到线上环境,并支持周期性调度,也可以发布到DataWorks与其它上下游任务节点打通依赖关系。另外调度任务区分生产环境以及开发环境,可以做到数据安全隔离。即数据在MaxCompute或OSS上,PAI完成数据建模。

PAI的使用流程

PAI的可视化建模可以基于模板,也可以自己新建一个。

PAI的数据建模

在明确任务、目标、并且掌握数据实际情况前提下,即完成商业理解任务、数据理解任务前提下,开始机器学习的数据建模过程:

  • 数据预处理

  • 选择特征

  • 选择模型进行数据训练

  • 模型评估

  • 应用部署及再学习、再训练

PAI三种建模方式

  • PAI-AutoLearning

PAI-AutoLearning支持在线标注自动模型训练超参优化以及模型评估。只需少量标注数据为输入,无需人工智能基础、无需写代码、无需调参,模型训练完整过程交给PAI AutoLearning,即可得到高可用的模型。

  • PAI-Studio

PAI-Studio提供可视化的机器学习实验开发环境,帮助用户实现无代码开发人工智能相关服务。内置数百个成熟的机器学习算法,覆盖商品推荐、金融风控、广告预测等场景,满足用户不同程度的需求,即开即用。

  • PAI-DSW

通过DSW平台完成数据预处理算法开发模型训练以及模型部署,无需多平台切换。DSW内置了PAI团队深度优化过的Tensorflow框架,同时也支持通过打开Terminal自行安装第三方库。

PAI的在线预测、离线调度

PAI 除了提供模型训练功能,还提供了在线预测以及离线调度功能,让机器学习训练结果和业务可以无缝衔接。

阿里大数据分析与应用(part7)--机器学习平台PAI相关推荐

  1. 刚刚,阿里重磅发布机器学习平台PAI 3.0!

    \u003cblockquote\u003e\n\u003cp\u003e3月21日,2019 阿里云峰会在北京召开,会上阿里巴巴重磅发布了机器学习平台PAI 3.0版本.距离PAI 2.0发布已经过 ...

  2. 独家解读!阿里重磅发布机器学习平台PAI 3.0

    策划编辑|Natalie 编辑|Debra AI 前线导读:3 月 21 日,2019 阿里云峰会在北京召开,会上阿里巴巴重磅发布了机器学习平台 PAI 3.0 版本.距离 PAI 2.0 发布已经过 ...

  3. 阿里云机器学习平台PAI+AI开源项目测评来啦

    一.背景介绍 阿里AI(阿里灵杰)依托阿里领先的云基础设施.大数据和AI工程能力.场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的AI能力体系.帮助提升AI应用开发效率,促进AI在产业中 ...

  4. 阿里云机器学习平台PAI与华东师范大学论文入选SIGIR 2022

    阿里云机器学习平台PAI与华东师范大学高明教授团队合作在SIGIR2022上发表了结构感知的稀疏注意力Transformer模型SASA,这是面向长代码序列的Transformer模型优化方法,致力于 ...

  5. 参与赢大奖!阿里云机器学习平台PAI助力开发者激发AIGC潜能

    近年来,随着海量多模态数据在互联网的爆炸性增长和训练深度学习大模型的算力大幅提升,助力开发者一站式快速搭建文生图.对话等热门场景应用,阿里云机器学习平台PAI特推出AIGC加油包,为广大开发者加油助力 ...

  6. 阿里大数据分析展示工具DataV

    原文地址为: 阿里大数据分析展示工具DataV 应用场景 当我们把清理好的数据,放到了数据库中,浏览数据的时候,直接访问数据库,或者通过JDBC连接代码返回数据,很不方便,我们需要通过报表的形式,通过 ...

  7. 要闻君说:重磅!阿里巴巴发布了机器学习平台PAI 3.0版本;厉害!三星推出了业界首款HBM2E内存;Google也做云游戏平台...

    关注并标星星CSDN云计算 每周三次,打卡即read 更快.更全了解泛云圈精彩news go go go 偶是要闻君.最近圈儿内的大型活动真是挤满台历,例如阿里云一年一度的大峰会,这不就在北京开上了! ...

  8. 阿里大数据分析与应用(part4)--一站式大数据平台DataWorks

    学习笔记,仅供参考,有错必纠 文章目录 一站式大数据平台DataWorks 大数据开发平台-DataWorks DataWorks 的主要功能及作用 DataWorks基本操作 数据平台开发流程 数据 ...

  9. 阿里大数据分析与应用(part3)--常用的大数据分析平台

    学习笔记,仅供参考,有错必纠 文章目录 常用的大数据分析平台 什么是大数据分析平台 基于Hadoop的大数据分析平台 阿里云大数据平台 典型阿里云大数据平台架构 MaxCompute MaxCompu ...

最新文章

  1. 聊聊JS与设计模式之(工厂Factory)篇------(麦当劳的故事)
  2. 前缀、中缀、后缀表达式(转载)
  3. NodeJs回调操作Promise化
  4. 在java中使用关键字导入包_java中import关键字的使用方法
  5. 三维家可以导入别人的方案吗_三维激光扫描仪
  6. AT4519-[AGC032D]Rotation Sort【dp】
  7. C++离航篇——函数默认参数、函数重载、内敛函数
  8. 学计算机专业的自荐信,浙江大学(计算机类)自主招生自荐信范文
  9. IE浏览器网页无法缩放怎么办 解决IE浏览器网页无法缩放的方法
  10. 前端基础-html-水平线标签
  11. 零基础开始学 Web 前端开发,有什么建议?(视频教程)
  12. PHP 中的对象传递
  13. html5模板区别,网页设计和平面设计理念的六大区别
  14. linux修改系统语言为中文
  15. word操作 mathtype插入公式 表格
  16. 群晖套件 Transmission 汉化
  17. 互联网社交出海:赤子城年内涨幅280%,“深水区”故事如何说好?
  18. scikit-learn笔记
  19. 计算机更新一直在57转怎么办,win10系统更新到57%出现死机的原因和解决方法
  20. Oracle集群(RAC)时间同步(ntp和CTSS)

热门文章

  1. ubunut16.04解决网速慢的办法
  2. 7.4.5 鲁棒主成分分析 PCA
  3. linux tr命令完整,linux tr命令详解
  4. 多维数组的行优先和列优先, 数据描述语言
  5. java使用jeids实现redis2.6的list操作(4)
  6. LINUX服务器搭建和常用配置介绍
  7. 【蓝鸥Unity开发基础三】课时14 刚体
  8. 【算法学习笔记】19.算法设计初步 最大子列和问题的几种方法
  9. Python学习预备
  10. IT公司笔试题总结(三)