阿里云组件的更新频率很快，存在部分内容描述与现版本不一致的情况，最新版本特性请参考阿里云官方文档。

阿里云官方帮助文档链接：https://help.aliyun.com/

阿里云各组件简介：https://blog.csdn.net/yiqiu3812/article/details/107076659

1 ADS

1.1 简介

云原生数据仓库AnalyticDB MySQL版（简称ADB，原分析型数据库MySQL版），是阿里巴巴自主研发的海量数据实时高并发在线分析云计算服务，使得您可以在毫秒级针对千亿级数据进行即时的多维分析透视和业务探索。

云原生数据仓库AnalyticDB又称ADB又被称为ADS，以下仅用ADS。

1.2 UPDATE_TYPE相关

UPDATE_TYPE可设置数据的更新方式，可设置为batch（批量更新数据）和realtime（实时更新数据），默认值是batch，当设置为batch时，如果支持增量导入，必须指二级分区。

UPDATE_TYPE=realtime时必须指定主键并且不能有二级分区。

UPDATE_TYPE=realtime时只能通过insert/delete实时更新数据，注意不能进行update操作。

1.3 ECU相关

弹性计算单元（Elastic compute units，简称ECU），是ADS中实例计算能力的元单位。ECU由内存容量和磁盘容量组成。ADS有高性能和大存储两种ECU。

高性能ECU：以字母C或者H开头的ECU为高性能实例，数据存储在SSD中。适用对性能要求高、查询并发高的业务场景。

大存储ECU：以字母S开头的ECU为大存储实例，采用SSD/HDD分层存储，热点数据存储在SSD中，冷数据存储在HDD中。适用并发稍低、性能要求不高（查询响应时间超过10秒以上）的场景。

用户可通过DDL语句alter database set ecu_count=N来修改ECU的个数。

注意：扩容或者缩容不是瞬间的同步操作。一个ADS库不可以同时使用两种类型的ECU。

1.4 最终一致性

ADS进行实时插入和删除时，不支持事务，并且遵循最终一致性的设计，所以分析型数据库不能作为OLTP系统使用。注意是最终一致性而不是会话一致性。

当updatetype=realtime时，对于不同主键数据的多次变更，ADS不保证先执行的变更会比后执行的变更优先查询到。由于遵循最终一致性，所以当业务端暂停数据写入的若干时间后，ADS会保证数据的一致性。对于同一主键数据的多次变更，ADS会遵循ADS返回语句执行成功的顺序进行。

1.5 分布式策略

ADS中数据根据分区列进行分布式的存储和计算。

1.6 逻辑计划节点

SelectNode表示这个select中最终输出表达式的相关信息，例如select要输出的表达式集合。

GroupNode表示Group By语句的相关信息，例如group by的列，having的表达式等。

OrderByNode表示Order By的列信息，例如列名，顺序等。

JoinNode表示逻辑Join树的信息，例如join的on条件。

TableNode表示分区表的信息，例如参与计算的列，表名等。

注意，ExecutorNode不属于逻辑计划节点。

1.7 聚集列相关

在分析型数据库MySQL版中，数据存储支持按一列或多列进行排序（先按第一列排序，第一列相同情况下使用第二列排序），以保证该列中值相同或相近的数据保存在磁盘同一位置，这样的列我们称之为聚集列。

当以聚集列为查询条件时，由于查询结果保存在磁盘同一位置，可以减少输入/输出I/O（Input/Output）次数。分析型数据库MySQL版中主聚集列只有一列，因此需要选择最合适的列作为主聚集列。

创建表的时候可以指定一列或者若干列作为聚集列，用户的Query的条件中会指定聚集列的内容或者范围，那么这样的查询性能便会有较大的提升，一个分区内聚集列内容相同的数据会尽可能的分布在相同的区块内存。

需要注意的是聚集列在建表后修改，修改后DB不会在后台自动刷新数据，修改后要等到下次装载数据完毕后生效。

聚集列能智能提升查询性能。

1.8 索引

智能自动索引会自动为导入数据的每一列创建符合该列情况的索引类型，无需用户显示指定创建索引或者索引类型。

1.9 多值列

多值列用于表示一个列中（Cell）有多个不确定的值，一个多值列字段可以包含多种ADB支持的数据类型。一个表中可以定义一个或多个多值列，多值列可以作为筛选条件，也可以进行分组或者参与连接过滤等。

多值列支持in、contains等查询。

ADS的多值列，不允许在不经由WHERE子句中用IN/CONTAINS进行枚举筛选的情况下直接在SELECT/GROUP BY中使用。

1.10 优化策略

ADS的高度智能优化策略是CBO，ADS分析型数据库拥有高度智能的CBO（Cost Based Optimization）优化策略。

1.11 连接方式

ADS支持使用版本为5.4系列的mysql-jdbc驱动、支持安装了php-mysql-5.1.x模块的php环境、支持mysql5.6的客户端、支持用户管理控制台中的DMS、支持Navicat、DBeaver、DBVisualizer、SQLWorkBeanch/J、BI可视化工具、MySQL命令行工具连接ADS集群。也可以通过配置集群连接地址、端口、数据库账号等信息连接地址端口、数据库账号等信息连接ADS。

1.12 用户权限

用户是被授权的数据库用户，由数据库拥有者授权时添加，无需开通ADS服务。

支持ACL，不支持policy授权。

不可以删除用户，可以回收用户。

1.13 表连接

ADS不支持right join、semi join、full join，不支持没用on条件的子句，支持笛卡尔积。

1.14 ECU

使用用户管理控制台来创建ADS时，需要提供ECU的存储、内存、数量、vCPU。

用户在创建数据库时需要根据自己的需求选择这个数据库的ECU型号，以及初始的ECU数量（必须是偶数个，至少两个），ECU型号DB创建后不可修改，ECU数量可以在使用中随时调整（扩容/缩容）。

1.15 优点

ADS无需预先建模。

1.16 维表表组

ADS的维表表组中存放的表的特点包括需要和任何表关联、数据量较小的特点，目前有且仅有一个，并且在ADS数据库建立时会自动创建，用户不可修改和删除。

1.17 建表限制

ADS创建普通表时，一个普通表组最多可以创建256个普通表，一张普通表至少有一级Hash分区并且分区数不能小于8个，一个普通表最多不能超过1024列。

2 ODPS

2.1 简介

MaxCompute（原ODPS）是一项大数据计算服务，它能提供快速、完全托管的PB级数据仓库解决方案，使您可以经济并高效的分析处理海量数据。

下面会全程用ODPS代指MaxCompute。

2.2 权限管理

权限管理操作均是对效果（授权、撤销）、对象（如表、资源等）、主题（用户或是角色）、操作（读、写、删除等）的组合描述。权限不属于ODPS的访问控制元素。

当项目空间的Owner决定对另一个用户授权时，需要先将该用户添加到子集的项目空间中来，只有添加到项目空间中的用户才能被授权。

当一个用户被移除后，该用户有关的ACL授权仍然会被保留。一旦该用户以后被再添加到该项目空间时，该用户的历史的ACL授权访问权限将被重新激活。

2.3 用户认证

ODPS中用户认证（Authentication）的主要功能是检查请求（Requiest）发送者的真实身份，包含以下几个认证：正确验证消息发送方的真实身份、正确验证接收到的信息在途中是否被篡改、正确验证用户状态，包括是否欠费等。不提供用户个性化信息验证。

2.4 权限管理

ODPS中通过安全授权，可以在一个项目空间中访问另一个项目空间。

一个用户可以拥有多个项目空间的权限。

一个账号可以创建多个项目空间，最多不能超过10个。

当一个用户被移除后，与该用户有关的ACL授权仍然会被保留。一旦该用户以后被再添加到该项目空间时，该用户历史的ACL授权访问权限将被重新激活。

没有被使用的角色才可以被删除。角色是一组访问权限的集合，admin为缺省角色。相比Owner，Admin不能将Admin角色赋给别的用户，不能设定项目空间的鉴权模型。角色的限制中，Admin角色的权限不能被修改。

ODPS数据管理的权限管理模块主要包括我已处理、权限回收、待我审批和审批记录。

2.5 表名列名命名规范

表名和列名都大小写不敏感，都只能用英文的a-z、A-Z、数字和下划线，且建议以字母开头，名字的长度不超过128字节，否则报错。

2.6 实例化

ODPS中并不是所有的任务都会被实例化（instance），计算型任务在执行的时候会被实例化，用户可以操作这个实例（instance）的信息，另一方面，部分ODPS任务并不是计算型的任务，非计算型任务运行的时候不会实例化。

2.7 使用限制

ODPS中，允许的SQL最大长度为2M。

ODPS表string列内容长度不允许超过2MB。单个任务引用的资源数量不超过512个分区表。单个任务引用的资源总字节数大小不超过64MB。单个任务的输入路数不能超过128，单个任务的输出路数不能超过128路。单个任务中自定义Counter的数量不能超过64。单个Map或Reduce Worker占用memory默认为2048MB，范围256MB-12GB。单个Map或Reduce Worker重复读一个资源次数限制<=64次。本地运行模式下，Map Worker个数不能超过100，Reduce Worker个数不能超过100。默认一路输入下载记录数100。

2.8 项目空间对象类型

ODPS的项目空间对象类型包括实例、资源和表，不包括Jar包。

2.9 ODPS SQL

ODPS SQL采用的是类似于SQL的语法，可以看作是标准SQL的子集，但不能因此简单得把ODPS SQL等价成一个数据库，它很多方面并不具备数据库的特征，如事务、主键约束、索引等。目前在ODPS中允许的最大SQL长度是2MB。

ODPS SQL不支持事务、主键约束、索引。

2.10 ODPS MR特点

什么情况下ODPS MR中Java Sandbox报错"access denied"？

获取本地IP、直接访问本地文件、使用Java反射、起子进程执行Linux命令会导致Java Sandbox报错"access denied"。

ODPS MR的Java Sandbox不允许直接访问本地文件，只能通过ODPS MapReduce/Graph提供的接口间接访问。不允许直接访问分布式文件系统，只能透过ODPS MapReduce/Graph访问到表的记录。不允许JNI调用限制，不允许创建Java线程，不允许起子线程执行Linux命令。

ODPS扩展MR的主要特点是支持Map后连续任意多个Reduce操作。

2.11 odpscmd

在有1000万行数据的t表中想随意抽取10行数据，消耗时间最短的方式是read t 10。read t可以随机读取10条记录。

select * from t limit 10是取前十条记录，不能随机抽取。

2.12 分区裁剪

两个分区表进行join的时候主表会进行分区裁剪，比如 t1 left outer join t2 t1表会进行分区裁剪。

2.13 数据倾斜解决方法

ODPS SQL任务中，发现join操作数据有数据倾斜时，可以考虑用mapjoin hint的方法优化。

2.14 加载数据

加载数据到ODPS可以通过dship、tunnel、mapreduce，不能通过DT task加载数据。

2.15 mapjoin

ODPS mapjoin不适用于两个表无条件关联、关联表中有临时表、两个大表关联的情况。注意，or连接关联条件可以使用ODPS mapjoin。

2.16 扩容步骤

热点扩容流程分为配置>迁移>切换>清理四个步骤。注意，不需要重启实例和增量同步。

2.17 程序提交及运行步骤

ODPS的Scheduler模块负责轮询Instance的执行状态。

Worker处理所有RESTful请求，包括用户空间（project）管理操作、资源（resource）管理操作、作业管理等。

SQL DML、MR、DT等启动Fuxi任务的作业，会提交Scheduler进一步处理。

Scheduler负责Instance的调度，包括将Instance分解为task，对等待提交的task进行排序、以及向计算机集群的Fuxi master询问资源占用情况以进行流控（Fuxi slot满的时候，停止响应Executor的task申请）。

Executor负责启动SQL/MR task，向计算集群的Fuxi master提交Fuxi任务，并监控这些任务的运行。

工作流描述了Job中各个Instance之间的依赖关系和运行约束，本质是个DAG（有向无环图）

Instance是个动态概念，每个Instance只能运行一次。

Job是个静态概念，被提交到系统开始执行时，该Job就拥有一个Instance。

2.18 资源

当添加的资源为分区表时，ODPS仅支持将某个分区作为资源，不支持将整张分区表作为资源。

2.19 ACL授权

ODPS中的ACL授权方式进行授权时，可以使用通配符，但是，目前仅支持星号(*)

2.20 LabelSecurity

ODPS通过基于标签的安全策略（LabelSecurity）实现用户对列级别敏感数据的访问。LabelSecurity是项目级别的一种强制的访问控制策略。

LabelSecurity需要将数据和访问数据的人进行安全等级划分。在政府和金融机构，通常将数据的敏感度标记（Label）分为四级，0级（不保密，Unclassified）、1级（秘密，Confidential）、2级（机密，Sensitive）、3级（高度机密，Highly Sensitive）。

ODPS也遵循上述的安全级别划分。项目所有者（Project Owner）需要定义明确的数据敏感等级和访问许可等级划分标准。默认情况下所有用户的访问许可等级为0级，数据安全级别为0级。

SET LABEL 2 TO TABLE t1(id);

2.21 控制层

ODPS的控制层主要功能包括用户空间（project）管理。

对象管理，包括对表、资源、作业的管理。

命令的解析和执行。

元数据的管理。

3 DMS

3.1 简介

数据管理DMS是一种集数据管理、结构管理、用户授权、安全审计、数据趋势、数据追踪、BI图表、性能与优化和服务器管理于一体的数据管理服务。

就是集中管理多种数据库的用户权限啥的。

3.2 功能

DMS支持MySQL、SQL Server、PostgreSQL、MongoDB、Redis等关系型数据库和NoSQL数据库。

DMS提供数据管理、结构管理、实例管理、诊断优化、文件管理、命令终端、实时监控和系统管理。只负责管理不支持创建数据库！

4 OTS

4.1 简介

表格存储（Tablestore）是阿里云自研的面向海量结构化数据存储的Serverless NoSQL多模型数据库，被广泛用于社交、物联网、人工智能、元数据和大数据等业务场景。提供兼容HBase的WideColumn模型、消息模型Timeline以及时空模型Timestream，可提供PB级存储、千万TPS以及毫秒级延迟的服务能力。

表格存储（Tablestore）又称OTS下面全程用OTS代指Tablestore。

4.2 数据类型

OTS支持Integer、Boolean、Double、String、Binary，不支持varchar。

4.3 存储方式

OTS以键值对的方式存储数据

OTS以实例和表的形式组织数据，通过数据分片和负载均衡技术达到规模的无缝扩展。

4.4 收费维度

OTS会根据外网下行流量、数据存储、预留读写吞吐量去计算费用，不会按数据访问次数（万次）去计算费用。

4.5 存储限制

OTS单个分片下所有行的大小总和不能超过1G。

OTS的单个表可以包括无限个属性列。

4.6 可预期性能

OTS根据表的预留读/写吞吐量进行资源的调度和预留，从而保证应用获得可预期的性能，也就是为了保证应用获得可预期的性能，需要设置OTS表的预留读吞吐量和预留写吞吐量，不需要指定预留处理内存。

4.7 用户管理控制台

QPS、平均返回延迟值、读写吞吐量，注意用户管理控制台不能直接获得TPS。

4.8 其他

OTS python Cu工具支持python 2.7。

5 其他数据库相关

5.1 实例创建数据库个数限制

同一实例下的数据库共享该实例下的所有资源。

MySQL版实例最多可以创建500个数据库，SQL Server 2008 R2版实例最多可以创建50个数据库，PostgreSQL版实例和PPAS版实例没有数据库个数限制。

5.2 日志类型

MySQL数据库为binlog日志，SQL Server为事务日志。

5.3 数据类型相关

RDS SQL Server中的大字段包括image、text、int，不包括varchar。

6 图表设计相关

6.1 显示构成成分

树图、饼图、雷达图适合显示构成成分。

树图1

树图2

饼图

雷达图

以上图表参考来自ECharts

7 云盾

7.1 简介

没什么简介，云盾是阿里云上与安全相关的一类服务。

7.2 密钥管理

云盾加密服务借助加密服务，用户能对密钥进行安全可靠的管理。

管理云盾加密服务的密钥时，必须通过身份证（USB KEY）进行管理，所有的加密服务实例都需要使用用户手里的身份识别卡（USB KEY）进行管理。此卡仅客户持有，请妥善保管。

7.3 DDoS防护

云盾DDoS基础防护功能会自动开通。

云盾DDoS防护功能可以防护ACK Flood、SYN Flood、UDP Flood、ICMP Flood、DNS Flood、CC攻击等4到7层的DDoS的攻击。

7.4 报警方式

在管理控制台的云盾配置页里可以设置手机短信、电子邮箱、实时电话”报警方式“，通过这些方式，用户可以在出现风险的第一时间收到事件通知。

7.5 加密机制

云盾加密服务采用符合国家密码管理局要求的算法，以及部分国际通用密码算法来保证密钥的安全。

7.6 云盾态势感知

云盾态势感知免安装，免维护，无需安装任何软件，部署任何设备无需复杂配置和更新，省心省力安全管控从未如此简单。云盾态势感知是一个针对阿里云服务器的管家式服务。建设安全体系从黑客角度监控云上业务安全，对异常行为进行实时告警让安全“可见、可控、可管”。注意，云盾态势感知不可以对入侵造成的损失进行评估。

7.7 云盾先知

云盾先知计划的目的时帮助企业建立私有的应急响应中心。

7.8 云盾网络安全专家

安全网络时通过IP节点组成的，具备流量转发，流量调度能力的一个网络。他需要通过配置和接入才能使您的应用具备攻击防护的能力。一个IP节点就相当于您服务器的一个替身，通过n多个替身节点来抵御攻击。黑客无法透过安全节点攻击到您的真实服务器。适用于每月一次的产品促销活动，担心网络攻击的场景。

8 安骑士

8.1 简介

安骑士全新升级为云安全中心高级版。又改名了，看来迭代很快。

云安全中心是一个实时识别、分析、预警安全威胁的统一安全管理系统，通过防勒索、防病毒、防篡改、合规检查等安全能力，
帮助用户实现威胁检测、响应、溯源的自动化安全运营闭环，保护云上资产和本地主机并满足监管合规要求。

8.2 功能

安骑士提供木马文件检查、异地登录报警和高危漏洞修复功能，不提供防止WEB应用系统密码破解功能。

9 DataWorks

9.1 简介

DataWorks是从工作室、车间到工具集都齐备的一站式大数据工场，助力您快速完成数据集成、开发、治理、服务、质量和安全等全套数据研发工作。

一个PaaS平台。

9.2 周期性调度

DataWorks支持的调度周期包括分钟、小时、日、周和月，不支持1分钟调度，不支持季度调度。

9.3 运维中心

DataWorks的运维中心中支持的批量操作有添加报警、修改责任人、修改资源组、添加到基线、暂停（冻结）、恢复（解冻）和下线节点等操作。注意，不支持批量修改调度周期。

运维中心仅运维角色和项目管理员可以进行运维中心的操作。能执行发布包，发布任务的角色有项目管理员、运维以及部署。

9.4 SQL脚本

DataWorks的SQL脚本可以用于数据开发人员使用建表语句建表、数据分析师使用SQL探查表数据、数据开发人员发调度任务调式成功后使用SQL检查表中的数据是否正常。注意，SQL脚本不能用于数据科学家在脚本文件中调度机器学习任务实现复杂分析。

9.5 数据同步

在DataWorks中使用数据同步任务将云数据库RDS（MySQL）加载到大数据计算服务时，为了提高单个数据同步任务的速度与效率，可以采用提高作业速率上限配置以及将云数据库RDS表的主键配置为切分键。

10 云监控

10.1 监控类型及监控项

云监控里的站点监控可以对目标站点服务的可用性以及响应时间监控。系统已经默认预置了8种监控类型，包括http监控、ping监控、tcp监控、udp监控、DNS监控、pop监控、smtp监控、ftp监控，其中每种监控类型里面包含了两个监控项，分别是状态码：status和响应时间：responsetime。监控项不包括响应内容长度：length和请求时间：requestime。

11 RDS

11.1 数据转移功能

RDS支持云外MySQL数据库的迁入。

在利用ROS管理控制台将数据迁移至RDS MySQL中的时候，使用的方法时MySAL在线迁移，可以不停止服务就能完成数据库的迁移工作，但MySQL 5.0不支持在线迁移。

11.2 只读实例

1个主实例最多可以创建5个只读实例。只读实例不支持备份设置以及临时备份，不支持数据迁移至只读实例，不支持创建和删除数据库，不支持创建和删除账号，不支持为账号授权以及修改账号密码功能，不支持通过备份文件或任意时间点创建临时实例，不支持通过备份集覆盖实例，创建只读实例后，主实例将不支持通过备份集直接覆盖实例来恢复数据。

RDS只读实例变更配置过程中，RDS主实例无法进行备份实例、创建实例、内外网切换。可以查看SQL审计日志。

只读实例能分担RDS主实例的写压力。只读实例只能在RDS管理控制台释放。

11.3 优势

高性能，底层使用高端服务器。高可用性，采用主从热备的架构。高安全性、具有网络防护能力和SQL审计。易用性，控制台自助迁移和管理。

11.4 使用注意

用户不具有数据库root权限。可以使用命令行或图形界面进行逻辑备份。用户可以使用Mysqldump进行数据导入。不支持第三方工具物理备份。

11.5 大小限制

阿里云MySQL数据库尺寸限制为2TB，这并不是MySQL对单表的限制，而是RDS实例最大的尺寸为2TB，因此单表的最大尺寸为略小于2TB（因为会有些元数据等的开销）。若RDS的MySQL实例有多张表，多张表的总和也不能超过2TB。

单表的有效最大尺寸通常受限于操作系统的文件尺寸限制。单一实例下所有表的空间加起来不能超过2TB。单表尺寸最大为2TB。

11.6 最大连接数

用户在购买RDS实例时所选择的内存大小决定了该实例的最大连接数。

11.7 创建数据库

RDS创建数据库时必须使用open api或RDS管理控制台进行操作。

12 Tunnel

12.1 upload上传文件

Tunnel upload命令支持文件或者目录的上传，每一次上传只支持数据上传到一个表或表的一个分区，有分区的表一定要指定上传的分区。

12.2 endpoint

Tunnel服务的公网endpoint是http://dt.odps.aliyun.com

13 ECS

13.1 修改私网IP

当通过控制台进行专有网络VPC内的云服务器ECS实例的私网IP地址修改时如果遇到操作的菜单不可用，是因为没有针对该云服务器ECS实例进行停止操作，且该云服务器ECS实例不是停止状态。

修改ECS的私网IP需要先把ECS实例停止。

14 流计算

14.1 简介

阿里云实时计算（Alibaba Cloud Realtime Compute）是一套基于Apache Flink构建的一站式、高性能实时大数据处理平台，广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

14.2 应用场景

阿里云实时计算可用于以下应用场景：离线数据仓库、实时报表、实时数据仓库、实时监控。注意，阿里云实时计算可用于离线数据仓库的场景。

14..3 接口

阿里云流计算对外接口包括StreamSQL/UDF。注意，不包括MapReduce和Graph。

15 数据集成

15.1 同步三要素

数据集成中的数据同步三要素是数据源、数据目的端、数据转换过程。注意，元数据不是数据集成中数据同步的要素。

16 DRDS

16.1 DRDS读策略

DRDS的读策略包含均测、主库读、自定义，不包括主库写。

其他

SLB

SLB不允许跨Region容灾。

分类模型

分类模型可以通过一些计算指标或者图表进行性能评估，用于分类模型评估的指标有混淆矩阵、F1 score、ROC。注意，DBI是增益率，Square Loss是损失函数，不属于分类模型评估指标。

阿里云大数据组件零碎点总结（不定时更新）相关推荐

阿里云大数据组件的基本介绍
阿里云大数据组件的基本介绍注意:本文结合了本人对Hadoop生态和Spark的理解,阅读本文需要对传统的大数据组件有基本的认识和了解.本文不具备权威性,若要准确地了解阿里云大数据组件的特性请直接查看 ...
阿里云大数据组件选型
大数据使用场景E-MapReduce 产品当前主要满足企业的以下大数据场景:批处理场景该场景对磁盘吞吐和网络吞吐要求高,处理的数据量也大,但对数据处理的实时性要求不高,您可选用 MapReduce.P ...
ACP入门篇-阿里云大数据平台经典架构
经典架构图阿里云大数据组件速览阿里云大数据与Hadoop产品映射
阿里云大数据ACA总结
1. 概述数加是指阿里云大数据平台,包含了一系列的大数据产品及服务. 计算引擎(三类):离线计算.流式计算.在线计算 2. MaxCompute 由阿里云自主研发,提供针对TB/PB级数据.实时性要 ...
阿里云大数据ACA考点总结
根据考题自己整理的知识点 1. 概述数加是指阿里云大数据平台,包含了一系列的大数据产品及服务. 计算引擎(三类):离线计算.流式计算.在线计算 2. MaxCompute 由阿里云自主研发,提供针对 ...
阿里云大数据+AI技术沙龙上海站回顾 | 揭秘TPC-DS 榜单第一名背后的强大引擎...
11月16日,阿里云大数据+AI技术沙龙,首站上海站取得圆满成功.我们邀请到阿里巴巴计算平台事业部技术专家辛庸,辰山,抚月,诚历:高级技术专家铁杰,以及Intel软件工程师喻杉和大家进行分享交流. ...
【赵渝强老师】阿里云大数据ACP认证之阿里大数据产品体系
阿里大数据产品体系是基于阿里云飞天平台上的数据处理服务.主要分为阿里云大数据基础产品和阿里云数加平台,其产品架构图如下所示: 一.阿里云大数据基础产品 1.云数据库--RDS(ApsaraDB for ...
【实验】阿里云大数据助理工程师认证（ACA）- 机器学习实现基本统计分析
实验概述本实验在阿里云PAI机器学习平台上,对一组农业数据进行基本的统计分析,包括观察数据的分布情况,对农民的收入和其他变量的相关性进行分析,对不同区域的农民收入进行分组分析和对比分析,以探讨不同地 ...
阿里云大数据平台DataWorks(原DataX)
核心功能数据集成离线/实时数据同步复杂网络环境下,对丰富异构类型数据源高效稳定的移动和同步能力数据开发对MaxCompute中的数据进行加工 (SQL,UTF,Graph,MR).分析与发掘 ...