分区表是指在创建表时指定分区空间,即指定表内的某几个字段作为分区列。分区表实际就是对应分布式文件系统上的的独立的文件夹,该文件夹下是该分区所有数据文件。而分区可以理解为分类,通过分类把不同类型的数据放到不同的目录下。分类的标准就是分区字段,可以是一个,也可以是多个。

分区表的意义在于优化查询。查询表时通过where字句查询指定所需查询的分区,避免全表扫描,提高处理效率,降低计算费用。

MaxCompute将分区列的每个值作为一个分区(目录),您可以指定多级分区,即将表的多个字段作为表的分区,分区之间如多级目录的关系。

使用数据时,如果指定需要访问的分区名称,则只会读取相应的分区,可避免全表扫描,提高处理效率,降低费用。

分区类型

MaxCompute2.0对分区类型的支持进行了扩充,目前MaxCompute支持Tinyint、Smallint、Int、Bigint、Varchar和String分区类型。

分区使用限制

分区有以下使用限制。

  • 单表分区层级最多6级。
  • 单表分区数最多允许60000个分区。
  • 一次查询最多查询分区数为10000个分区。
  • String分区类型的分区值不支持使用中文。

来源:https://help.aliyun.com/document_detail/27820.html?spm=a2c4g.11186623.4.4.7702544eiZedzV

Maxcompute 分区相关推荐

  1. MaxCompute分区和列操作

    MaxComputeSQL DDL语句-分区和列操作 添加分区 为已存在的分区表新增分区. 限制条件 MaxCompute单表支持的分区数量上限为6万个. 对于有多级分区的表,如果需要添加新的分区值, ...

  2. 日志数据如何同步到MaxCompute

    摘要:日常工作中,企业需要将通过ECS.容器.移动端.开源软件.网站服务.JS等接入的实时日志数据进行应用开发.包括对日志实时查询与分析.采集与消费.数据清洗与流计算.数据仓库对接等场景.本次分享主要 ...

  3. 阿里云交互式分析与Presto对比分析及使用注意事项

    阿里云交互式分析与Presto对比分析及使用注意事项 本文由阿里巴巴耿江涛带来以"阿里云交互式分析与Presto对比分析及使用注意事项"为题的演讲.文章首先介绍了Presto以及它 ...

  4. 阿里云大数据工程师ACP认证例题

    1.在 MaxCompute SQL 中,常量定义 100BD 表示的含义是:(A)A.数值为 100 的 DECIMAL B.数值为 100 的 BigintC.数值为 100 的 StringD. ...

  5. 前端入门笔记01 —— html

    一些框架 html中如果要改内容要放在<body> </body>之间 <html lang = en><head><meta charset = ...

  6. 日志服务十大经典问题

    原文链接 日志服务十大经典问题 一. 非阿里云的机器能用logtail吗? 能用,装好logtail之后要额外做一个配置 先找到自己的阿里云账号ID,例如:123456 Linux touch /et ...

  7. MaxCompute 费用暴涨之新增SQL分区裁剪失败

    现象:因业务需求新增了SQL任务,这SQL扫描的表为分区表,且SQL条件里表只指定了一个分区,按指定的分区来看数据量并不大,但是SQL的费用非常高.费用比预想的结果相差几倍甚至10倍以上. 分析:我们 ...

  8. 阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区

    摘要: 当前,很多用户的业务数据存放在传统关系型数据库上,例如阿里云的RDS,做业务读写操作.当数据量非常大的时候,此时传系关系型数据库会显得有些吃力,那么会经常有将mysql数据库的数据迁移到[大数 ...

  9. 阿里云MaxCompute中pyODPS的使用:多线程上传、下载、分区

    文章目录 1 初始化入口 2 java可实现:SQLTask配合Tunnel实现大量数据导出 3 pyODPS 3.1 sql读入 3.2 DataFrame 3.2.1 dataframe读入 3. ...

最新文章

  1. 新风向标:学术界开始从 Python 转向 Rust
  2. CNN光流计算--FlowNet: Learning Optical Flow with Convolutional Networks
  3. QT的QGroupBox类的使用
  4. 动态规划算法——最长上升子序列
  5. jboss ds derby
  6. 问题二十九:测试ray tracing中camera几个主要参数
  7. Intel Mac无法使用macOS Monterey系统部分新功能
  8. java 读取 dto_DTO 实现 service 和 controller 之间值传递的操作
  9. 西刺代理python_python爬取西刺代理所有数据 !
  10. 专业主义——大前研一
  11. JAVA常用工具类汇总
  12. 网店系统SHOP++、V5shop、shopex全程分析
  13. vue 自定义 文字背景
  14. 不看OCJP考题你永远不知道自己的JAVA基础有多差(一)
  15. 为什么我们计算的RSI和同花顺通达信计算的值不一样
  16. Win7系统卸载McAfee杀毒软件
  17. Linux--环境变量和进程地址空间
  18. 【数据分析】洞察业务指标体系(in)
  19. spring mvc + JSR-303验证框架
  20. vue 渲染函数处理slot_详解Vue的slot新用法

热门文章

  1. java 运行cmd命令(执行多行)
  2. java 销毁cmd窗口
  3. redis的七种数据结构
  4. i5 1135g7和i7 1165g7核显一样吗 i51135g7和i71165g7的相差大吗
  5. 计算机显卡类型,电脑显卡有几类别型?
  6. 二叉排序树的中序遍历
  7. 晚睡强迫症..其实真的有——医学上的真正名字叫拖延症
  8. 检查邮件服务器的IP地址是否被列入RBL或DNSBL黑名单
  9. bitnami redmine mysql 密码_Linux使用bitnami安装redmine的图文教程
  10. 利用caffe的solverstate断点训练