Maxcompute 分区
分区表是指在创建表时指定分区空间,即指定表内的某几个字段作为分区列。分区表实际就是对应分布式文件系统上的的独立的文件夹,该文件夹下是该分区所有数据文件。而分区可以理解为分类,通过分类把不同类型的数据放到不同的目录下。分类的标准就是分区字段,可以是一个,也可以是多个。
分区表的意义在于优化查询。查询表时通过where字句查询指定所需查询的分区,避免全表扫描,提高处理效率,降低计算费用。
MaxCompute将分区列的每个值作为一个分区(目录),您可以指定多级分区,即将表的多个字段作为表的分区,分区之间如多级目录的关系。
使用数据时,如果指定需要访问的分区名称,则只会读取相应的分区,可避免全表扫描,提高处理效率,降低费用。
分区类型
MaxCompute2.0对分区类型的支持进行了扩充,目前MaxCompute支持Tinyint、Smallint、Int、Bigint、Varchar和String分区类型。
分区使用限制
分区有以下使用限制。
- 单表分区层级最多6级。
- 单表分区数最多允许60000个分区。
- 一次查询最多查询分区数为10000个分区。
- String分区类型的分区值不支持使用中文。
来源:https://help.aliyun.com/document_detail/27820.html?spm=a2c4g.11186623.4.4.7702544eiZedzV
Maxcompute 分区相关推荐
- MaxCompute分区和列操作
MaxComputeSQL DDL语句-分区和列操作 添加分区 为已存在的分区表新增分区. 限制条件 MaxCompute单表支持的分区数量上限为6万个. 对于有多级分区的表,如果需要添加新的分区值, ...
- 日志数据如何同步到MaxCompute
摘要:日常工作中,企业需要将通过ECS.容器.移动端.开源软件.网站服务.JS等接入的实时日志数据进行应用开发.包括对日志实时查询与分析.采集与消费.数据清洗与流计算.数据仓库对接等场景.本次分享主要 ...
- 阿里云交互式分析与Presto对比分析及使用注意事项
阿里云交互式分析与Presto对比分析及使用注意事项 本文由阿里巴巴耿江涛带来以"阿里云交互式分析与Presto对比分析及使用注意事项"为题的演讲.文章首先介绍了Presto以及它 ...
- 阿里云大数据工程师ACP认证例题
1.在 MaxCompute SQL 中,常量定义 100BD 表示的含义是:(A)A.数值为 100 的 DECIMAL B.数值为 100 的 BigintC.数值为 100 的 StringD. ...
- 前端入门笔记01 —— html
一些框架 html中如果要改内容要放在<body> </body>之间 <html lang = en><head><meta charset = ...
- 日志服务十大经典问题
原文链接 日志服务十大经典问题 一. 非阿里云的机器能用logtail吗? 能用,装好logtail之后要额外做一个配置 先找到自己的阿里云账号ID,例如:123456 Linux touch /et ...
- MaxCompute 费用暴涨之新增SQL分区裁剪失败
现象:因业务需求新增了SQL任务,这SQL扫描的表为分区表,且SQL条件里表只指定了一个分区,按指定的分区来看数据量并不大,但是SQL的费用非常高.费用比预想的结果相差几倍甚至10倍以上. 分析:我们 ...
- 阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区
摘要: 当前,很多用户的业务数据存放在传统关系型数据库上,例如阿里云的RDS,做业务读写操作.当数据量非常大的时候,此时传系关系型数据库会显得有些吃力,那么会经常有将mysql数据库的数据迁移到[大数 ...
- 阿里云MaxCompute中pyODPS的使用:多线程上传、下载、分区
文章目录 1 初始化入口 2 java可实现:SQLTask配合Tunnel实现大量数据导出 3 pyODPS 3.1 sql读入 3.2 DataFrame 3.2.1 dataframe读入 3. ...
最新文章
- 新风向标:学术界开始从 Python 转向 Rust
- CNN光流计算--FlowNet: Learning Optical Flow with Convolutional Networks
- QT的QGroupBox类的使用
- 动态规划算法——最长上升子序列
- jboss ds derby
- 问题二十九:测试ray tracing中camera几个主要参数
- Intel Mac无法使用macOS Monterey系统部分新功能
- java 读取 dto_DTO 实现 service 和 controller 之间值传递的操作
- 西刺代理python_python爬取西刺代理所有数据 !
- 专业主义——大前研一
- JAVA常用工具类汇总
- 网店系统SHOP++、V5shop、shopex全程分析
- vue 自定义 文字背景
- 不看OCJP考题你永远不知道自己的JAVA基础有多差(一)
- 为什么我们计算的RSI和同花顺通达信计算的值不一样
- Win7系统卸载McAfee杀毒软件
- Linux--环境变量和进程地址空间
- 【数据分析】洞察业务指标体系(in)
- spring mvc + JSR-303验证框架
- vue 渲染函数处理slot_详解Vue的slot新用法