最近,AWS 推出了亚马逊Apache Airflow托管工作流(MWAA),这是一项全托管的服务,简化了在 AWS 上运行开源版 Apache Airflow 和构建工作流来执行 ETL 作业和数据管道的工作。

Apache Airflow 是一个开源工具,用于通过编程的方式开发、调度和监控被称为“工作流”的过程和任务序列。开发人员和数据工程师用 Apache Airflow 管理工作流,通过用户界面(UI)来监控它们,并通过一组强大的插件来扩展它们的功能。但是,要使用 Apache Airflow,需要进行手动安装、维护和扩展。现在,AWS 解决了这个问题,它为开发人员和数据工程师提供了 MWAA,让他们可以在云端构建和管理自己的工作流,无需关心与管理和扩展 Airflow 平台基础设施相关的问题。

在 AWS 有关 MWAA 的新闻稿中,负责应用集成的副总裁 Jesse Dougherty 说:

客户告诉我们,他们非常喜欢Apache Airflow,因为它加快了数据处理和机器学习工作流的开发,但他们希望能够去掉扩展、运维和保护服务器方面的负担。通过使用Amazon MWAA,客户可以使用与现在相同的Apache Airflow平台,同时获得由AWS提供的可伸缩性、可用性和安全性。

Amazon MWAA 可以使用Amazon Athena获取来自数据源(如Amazon Simple Storage Service)的输入,在Amazon EMR集群上执行转换,并使用生成的数据在Amazon SageMaker上训练机器学习模型。此外,开发人员和数据工程师可以使用 Python 在 Amazon MWAA 中编写有向无环图(DAG)工作流。

来源:https://aws.amazon.com/managed-workflows-for-apache-airflow/

AWS 首席布道师 Danilo Poccia 在 NWAA 的一篇介绍博文中写道:

你可以通过以下三个步骤来使用亚马逊MWAA:

创建环境——每个环境都包含你的Airflow集群,包括调度器、工作程序和Web服务器。开发人员和数据工程师可以从控制台、AWS命令行接口(CLI)或AWS SDK创建新的Amazon MWAA环境。

上传DAG和插件到S3——Amazon MWAA自动将代码加载到Airflow中。

在Airflow中运行DAG——从Airflow UI或命令行(CLI)运行DAG,并使用CloudWatch监控环境。

有了 MWAA,开发人员和数据工程师可以通过插件获得开放可扩展性所带来的好处,他们可以创建与工作流所需的 AWS 或内部资源发生交互的任务,包括 AWS Batch、Amazon CloudWatch、Amazon DynamoDB、AWS Lambda、Amazon Redshift、Amazon Simple Queue Service (SQS)和 Amazon Simple Notification Service(SNS)。

需要注意的是,AWS 还有其他工作流管理系统,比如Step Functions和AWS Glue。Hacker News 上的一位受访者在一篇帖子中解释说:

它是由内部的Orchestration团队开发的——这个团队也开发了Step Functions,并维护着AWS Simple Workflow。我认为Glue与其他的工作流系统不一样——它针对ETL进行了深度优化。我相信,随着时间的推移,会出现更多有关Step Functions和Apache Airflow的详细指南,不过简单地说,Step Functions是完全AWS原生的(并且是无服务器的)编配引擎。当然,Apache Airflow是一个开源的项目,它拥有一个由其他插件组成的多样化生态系统。

MWAA 目前可在下列 AWS 区域使用:美国东部(俄亥俄州和弗吉尼亚州)、美国西部(俄勒冈州)、欧盟(斯德哥尔摩、爱尔兰和法兰克福)和亚太地区(东京、新加坡和悉尼),其他更多地区将会陆续可用。此外,有关服务的详细信息可以在文档页面上获得,有关价格的详细信息可以在定价页面上获得。

原文链接

AWS Introduces Amazon Managed Workflows for Apache Airflow

延伸阅读:

亚马逊re:Invent综述文章:|解读亚马逊re:Invent首日,AWS CEO五十多次提及重塑 加速企业上云及数字创新-InfoQ

关注我并转发此篇文章,私信我“领取资料”,即可免费获得InfoQ价值4999元迷你书,点击文末「了解更多」,即可移步InfoQ官网,获取最新资讯~

亚马逊aws 服务器删除_AWS推出Apache Airflow全托管工作流MWAA相关推荐

  1. 亚马逊aws 服务器删除_亚马逊aws服务器免费套餐及被扣款怎么办

    今天弄了一个aws免费套餐EC2服务器. 注册成功之后,就是申请EC2服务器了,官方有详细的操作教程:https://aws.amazon.com/cn/getting-started/tutoria ...

  2. 亚马逊aws 服务器删除_amazon-ec2 – 如何从ELB组中正常关闭或删除AWS实例

    这个想法使用ELB的能力来检测不健康的节点并将其从池中删除,但是它依赖于ELB在下面的假设中的行为.这是我自己测试的一些东西,但还没有时间.我会更新答案. 流程概述 在节点需要关闭时,可以包装和运行以 ...

  3. 亚马逊aws 服务器删除_如何删除amazon EC2里面的实例?

    从amazon客服得到的回答,我的情况是因为实例有active Elastic Beanstalk environment I've researched your account, and the ...

  4. 亚马逊aws深度学习_AWS速查表:Amazon Web Services入门时首先要学习的5件事

    亚马逊aws深度学习 AWS has taken the tech community by storm. It's easily sold as one of the most reliable p ...

  5. windows系统上利用putty通过SSH连接亚马逊AWS服务器

    1. 找到在购买亚马逊的AWS服务器时保存的密钥文件(假设为abc.pem). 2.打开PuTTYgen,如下图,点击图中1处的"load",找到abc.pem文件所在的位置,并选 ...

  6. 亚马逊AWS宣布在香港推出新的区域

    新的AWS亚太(香港)区域将扩充AWS全球足迹,让客户在香港数据中心运行其应用程序,存储业务内容,同时连接AWS全球网络. 香港特别行政区政府对此表示欢迎,引证香港对大型云基础设施的需求,视此为一个经 ...

  7. 亚马逊AWS服务器下载kaggle竞赛数据

    第一步 安装kaggle-cli pip install kaggle-cli 第二步 下载数据 kg download -c 'cifar-10(比赛名称)' -u 'username' -p 'p ...

  8. aws云服务器会自动扣费吗,亚马逊AWS云服务器不合理扣费怎么处理

    有些小伙伴可能不知道,亚马逊AWS对新用户有个免费体验一年的活动.如果希望体验免费亚马逊AWS云服务器产品,或者看看他们后台面板长什么样,体验产品的速度和性能,又或者准备搭建一个免费t z,可以 注册 ...

  9. 亚马逊aws免费云服务器搭建总结

    1.注册 如果你没有aws的账号需要注册 注册地址https://aws.amazon.com/cn/ 因为我已经注册成功,如果还没有注册的可以参照这个帖子非常详细 https://www.itbul ...

最新文章

  1. fieldset 使用小案例
  2. ITK:运算后的当前图像
  3. php curl处理get和post请求
  4. jQuery学习- 位置选择器
  5. mysqldump 的常用参数。
  6. Android 设备的CPU类型(通常称为”ABIs”)
  7. Go新手上路(时不时更新)
  8. Java乔晓松-oracle的条件查询和排序查询
  9. 微信表白神秘代码!快发给ta!
  10. 常见的几种深度学习网络
  11. Android 应用程序之间内容分享详解(一)
  12. python画图网格线设置_matplotlib之极坐标系的极径网格线(rgrids)的显示刻度
  13. 3D打印机赋予了海岸生态系统极大的恢复能力
  14. Phalcon框架的入门使用,Phalcon框架学习,编写简单的视图输出及数据库写入!
  15. IT男潘加宇:老婆在孩子班级群里怒怼数学老师
  16. Oxyplot实时绘图学习笔记(下)
  17. openjudge 7920 统计单词数
  18. 【堆】leetcode378.有序矩阵中第K小的元素
  19. win10 sdk各种版本下载地址
  20. IDEA——手把手教你mybatis的使用(新手教程)

热门文章

  1. 计算机教育日志,信息技术日志1
  2. linux whois rpm,CentOS系统安装whois命令的方法
  3. 计算机组装方案及分析,《计算机组装与维护》课程整体教学方案
  4. idea装python插件_学习idea2020手动安装python插件的实现方法
  5. 绝地求生哪个服务器延迟,绝地求生:腾讯公布国服服务器,超性能环境绝对稳定远离延迟!...
  6. java链表需要自己编写么_基于java的链表基础操作
  7. 线段树 区间加 gcd 差分
  8. Linux——自定义服务命令
  9. 项目第一天--ElementUI介绍
  10. chattr和lsattr命令的使用(对于root用户也无法修改删除的操作问题)