该文章主要针对于用户同region不同账户之间的MaxCompute数据迁移方式,属于迁移的方式可以有三种方式,一、添加MaxCompute数据源的方式进行数据迁移(该方式针对多个表配置同步节点较为繁琐);二、使用tunnel方式结合代码进行数据的迁移;三、使用clone table进行MaxCompute数据到另一MaxCompute之间的数据迁移。本案例主要介绍Clone table功能,Clone table跨账号进行同步数据,需要所做的添加对应的主账户到对应的项目空间,并且赋予有对应创建表权限的用户,最后实现不同MaxCompute之间的Clone table功能。

背景:
针对用户在不同MaxCompute之间进行数据迁移,使用三种方式的第一种、第二种进行数据的迁移造成了很多用户操作繁琐,在这里给大家带来一篇实践不同账号Clone table功能的一个范例,希望可以帮助到大家。

一、CLONE TABLE功能介绍

CLONE TABLE可以复制表数据到另一个表中,极大的提高了数据迁移的效率。本文为您介绍CLONE TABLE的使用。

使用限制

  • 要求目标表与源表的Schema兼容。
  • 支持分区表和非分区表。
  • 目标表已存在时一次性复制分区的数量上限为10000个。
  • 目标表不存在时无分区数量限制,满足原子性。

命令格式

CLONE TABLE <[src_project_name.]src_table_name> [PARTITION(spec), ...]TO <[dest_project_name.]desc_table_name> [IF EXISTS (OVERWRITE | IGNORE)] ;

具体使用情况请参阅CLONE TABLE功能介绍

二、添加用户与赋予用户权限

2.1进入需要同步数据的MaxCompute客户端,并添加目标源MaxCompute的主账号到目的空间

限制
只能将另一个主账户添加到本项目空间

涉及到的权限知识点可以参考MaxCompute与DataWorks权限介绍和示例

2.2查询所有角色,并查看对应角色的权限设置,并赋予新增用户的权限

三、在源MaxCompute创建对应的表,并插入数据

3.1在源MaxCompute创建对应的表并插入数据

CREATE TABLE IF NOT EXISTS git_project.testone(name STRING) STORED AS ALIORC;
INSERT INTO testone VALUES ('tom');
INSERT INTO testone VALUES ('tony');

四、clone数据,并确认数据是否clone是否成功

4.1在源MaxCompute执行命令

clone TABLE git_project.testone to WB_BestPractice_dev.testone IF EXISTS OVERWRITE;

4.2登录MaxCompute目的端,查看是否迁移完成
执行命令

select * from testone;

欢迎加入“MaxCompute开发者社区2群”,点击链接申请加入或扫描二维码
https://h5.dingtalk.com/invite-page/index.html?bizSource=____source____&corpId=dingb682fb31ec15e09f35c2f4657eb6378f&inviterUid=E3F28CD2308408A8&encodeDeptId=0054DC2B53AFE745

原文链接
本文为云栖社区原创内容,未经允许不得转载。

使用CLONE TABLE方式实现同region不同可用区的MaxCompute相关推荐

  1. 云区域(region),可用区(AZ),跨区域数据复制(Cross-region replication)与灾备(Disaster Recovery)(部分2)

    本文分两部分:部分1 和 部分2.部分1 介绍 AWS,部分2 介绍阿里云和OpenStack云. 2. 阿里云 2.1 阿里云各产品的HA和DR能力 地域:是指物理的数据中心.资源创建成功后不能更换 ...

  2. 玩转ECS第6讲 | 弹性计算Region化部署和跨可用区容灾介绍

    简介:本次分享由阿里云弹性计算架构负责人李钟(谢顿)为大家介绍阿里云region化部署和跨可用区容灾的实践经验,说明多Region部署场景中使用阿里云弹性计算的最佳实践,并结合弹性计算的实践经验探讨如 ...

  3. 玩转ECS第6讲 | 弹性计算 Region 化部署和跨可用区容灾介绍

    本次分享主要围绕以下三个方面: 一.Region和可用区介绍 二.Endpoints和资源作用域 三.多可用区容灾和Region化部署 弹性计算Region化部署和跨可用区容灾本身是非常复杂的课题,本 ...

  4. Spark: Structured JDBC 方式访问远程的高可用HA的HIVE

    1. 背景 Spark: Structured JDBC 方式访问远程的高可用HA的HIVE,hive是看高可用的,连接信息如下 jdbc:hive2://xx.cdh1.test.dtwave.in ...

  5. 关于阿里云香港Region可用区C服务中断事件的说明

    北京时间2022年12月18日,阿里云香港Region可用区C发生大规模服务中断事件.经过复盘,我们在这里向大家进一步说明故障情况.问题分析和改进措施. 处理过程 12月18日08:56,阿里云监控到 ...

  6. php 使用table方式导出excel文件

    这些天在使用PHPExcel导出数据时,5000条数据竟然挂了.后来跟同事聊聊,有些明悟,PHPExcel做了很多处理,我在这里理解为渲染,就会暂用过多的空间,'膨胀'的空间导致内存暂用过大,就挂了. ...

  7. android 实现挂断电话【四种方式】,亲测可用

    网上查到两种挂断电话方式 第一种:通过反射得到隐藏的API,需要aidl文件,但是这种方式测试后,无效.方法写出来吧,也许对你有你有帮助. 首先在main文件下创建报名com.android.inte ...

  8. 什么是Pinia?以及它的使用方式?以及和Vuex的区别是什么?

    文章目录 概要 什么是Pinia? Pinia和Vuex的区别? Pinia相比于Vuex的优势? 为什么要使用Pinia? Pinia的简单使用 安装(仅限于Vue3) 使用 概要 提示:下边是Pi ...

  9. [ 华为云 ] 云计算中Region、VPC、AZ 是什么,他们又是什么关系,应该如何抉择

    前几天看到一个问答帖,我回答完了才发现这个帖子居然是去年的也没人回复,其中他问了一些华为云的问题,对于其中的一些概念,这里来总结讲解一下,希望对学习华为云的小伙伴有所帮助. 文章目录 区域(Regio ...

最新文章

  1. Windows Phone播放视频流
  2. 数据中心液冷技术发展分析
  3. linux aemv7,无法在我的Ubuntu machin中安装“xlwings”
  4. 详解:Sqoop的导入和导出数据
  5. 论一个蒟蒻的脑子里可以有多少坑(貌似咕了……目前更新保持在noip阶段)
  6. 网众无盘linux挂载u盘,个人总结出的49条网众无盘系统常见故障解决方法
  7. 修改配色 Mac电脑默认命令行工具(终端\terminal) MacBook Pro MacBook
  8. Java学习笔记(十)——开发个小项目(GoBang2.0)
  9. Roundpic:超简单的在线图片圆角处理~
  10. Android 支付宝sdk接入问题:不能唤起支付宝客户端,或者偶然唤起支付客户端
  11. C++/java设计模式汇总
  12. 【机器学习】sklearn机器学习入门案例——使用k近邻算法进行鸢尾花分类
  13. 规范使用计算机的ppt,2016年职称计算机PowerPoint操作练习题
  14. SQL: 第二高的薪水
  15. 视频文件头解析--mkv
  16. 数独求解:用c++做一个数独求解的程序(附源代码和.exe文件)
  17. 【日常Exception】第二十四回:nested exception is java.lang.NoClassDefFoundError: redis/clients/jedis/util/Pool
  18. C语言中 -> 是什么意思?
  19. Java学习资料分享
  20. 参与社团活动的意义_开展社团活动的意义

热门文章

  1. Java设计模式之迭代器模式
  2. JAVA构架之并发编程的一些总结
  3. Java性能优化方面的程序优化知识点归纳,希望对你有所帮助
  4. fanuc机器人编程手册_是谁需要G代码编程机器人?
  5. 超级外链工具_哪些SEO排名工具是有效的呢?
  6. Ubuntu下的Linux内核的编译及安装
  7. java 浏览器 爬虫_java 网络编程-爬虫+模拟浏览器
  8. endnote怎么改成中文版_毕业论文面对大量的参考文献标注,应该怎么办?(便捷整理的技巧和方法)...
  9. 各自然带代表植被_植被垂直带谱?水与热之间的较量。
  10. lisp对excel其他行列写入_【极简Python 自动化办公】Python写入Excel表格