使用CLONE TABLE方式实现同region不同可用区的MaxCompute
该文章主要针对于用户同region不同账户之间的MaxCompute数据迁移方式,属于迁移的方式可以有三种方式,一、添加MaxCompute数据源的方式进行数据迁移(该方式针对多个表配置同步节点较为繁琐);二、使用tunnel方式结合代码进行数据的迁移;三、使用clone table进行MaxCompute数据到另一MaxCompute之间的数据迁移。本案例主要介绍Clone table功能,Clone table跨账号进行同步数据,需要所做的添加对应的主账户到对应的项目空间,并且赋予有对应创建表权限的用户,最后实现不同MaxCompute之间的Clone table功能。
背景:
针对用户在不同MaxCompute之间进行数据迁移,使用三种方式的第一种、第二种进行数据的迁移造成了很多用户操作繁琐,在这里给大家带来一篇实践不同账号Clone table功能的一个范例,希望可以帮助到大家。
一、CLONE TABLE功能介绍
CLONE TABLE可以复制表数据到另一个表中,极大的提高了数据迁移的效率。本文为您介绍CLONE TABLE的使用。
使用限制
- 要求目标表与源表的Schema兼容。
- 支持分区表和非分区表。
- 目标表已存在时一次性复制分区的数量上限为10000个。
- 目标表不存在时无分区数量限制,满足原子性。
命令格式
CLONE TABLE <[src_project_name.]src_table_name> [PARTITION(spec), ...]TO <[dest_project_name.]desc_table_name> [IF EXISTS (OVERWRITE | IGNORE)] ;
具体使用情况请参阅CLONE TABLE功能介绍
二、添加用户与赋予用户权限
2.1进入需要同步数据的MaxCompute客户端,并添加目标源MaxCompute的主账号到目的空间
限制
只能将另一个主账户添加到本项目空间
涉及到的权限知识点可以参考MaxCompute与DataWorks权限介绍和示例
2.2查询所有角色,并查看对应角色的权限设置,并赋予新增用户的权限
三、在源MaxCompute创建对应的表,并插入数据
3.1在源MaxCompute创建对应的表并插入数据
CREATE TABLE IF NOT EXISTS git_project.testone(name STRING) STORED AS ALIORC;
INSERT INTO testone VALUES ('tom');
INSERT INTO testone VALUES ('tony');
四、clone数据,并确认数据是否clone是否成功
4.1在源MaxCompute执行命令
clone TABLE git_project.testone to WB_BestPractice_dev.testone IF EXISTS OVERWRITE;
4.2登录MaxCompute目的端,查看是否迁移完成
执行命令
select * from testone;
欢迎加入“MaxCompute开发者社区2群”,点击链接申请加入或扫描二维码
https://h5.dingtalk.com/invite-page/index.html?bizSource=____source____&corpId=dingb682fb31ec15e09f35c2f4657eb6378f&inviterUid=E3F28CD2308408A8&encodeDeptId=0054DC2B53AFE745
原文链接
本文为云栖社区原创内容,未经允许不得转载。
使用CLONE TABLE方式实现同region不同可用区的MaxCompute相关推荐
- 云区域(region),可用区(AZ),跨区域数据复制(Cross-region replication)与灾备(Disaster Recovery)(部分2)
本文分两部分:部分1 和 部分2.部分1 介绍 AWS,部分2 介绍阿里云和OpenStack云. 2. 阿里云 2.1 阿里云各产品的HA和DR能力 地域:是指物理的数据中心.资源创建成功后不能更换 ...
- 玩转ECS第6讲 | 弹性计算Region化部署和跨可用区容灾介绍
简介:本次分享由阿里云弹性计算架构负责人李钟(谢顿)为大家介绍阿里云region化部署和跨可用区容灾的实践经验,说明多Region部署场景中使用阿里云弹性计算的最佳实践,并结合弹性计算的实践经验探讨如 ...
- 玩转ECS第6讲 | 弹性计算 Region 化部署和跨可用区容灾介绍
本次分享主要围绕以下三个方面: 一.Region和可用区介绍 二.Endpoints和资源作用域 三.多可用区容灾和Region化部署 弹性计算Region化部署和跨可用区容灾本身是非常复杂的课题,本 ...
- Spark: Structured JDBC 方式访问远程的高可用HA的HIVE
1. 背景 Spark: Structured JDBC 方式访问远程的高可用HA的HIVE,hive是看高可用的,连接信息如下 jdbc:hive2://xx.cdh1.test.dtwave.in ...
- 关于阿里云香港Region可用区C服务中断事件的说明
北京时间2022年12月18日,阿里云香港Region可用区C发生大规模服务中断事件.经过复盘,我们在这里向大家进一步说明故障情况.问题分析和改进措施. 处理过程 12月18日08:56,阿里云监控到 ...
- php 使用table方式导出excel文件
这些天在使用PHPExcel导出数据时,5000条数据竟然挂了.后来跟同事聊聊,有些明悟,PHPExcel做了很多处理,我在这里理解为渲染,就会暂用过多的空间,'膨胀'的空间导致内存暂用过大,就挂了. ...
- android 实现挂断电话【四种方式】,亲测可用
网上查到两种挂断电话方式 第一种:通过反射得到隐藏的API,需要aidl文件,但是这种方式测试后,无效.方法写出来吧,也许对你有你有帮助. 首先在main文件下创建报名com.android.inte ...
- 什么是Pinia?以及它的使用方式?以及和Vuex的区别是什么?
文章目录 概要 什么是Pinia? Pinia和Vuex的区别? Pinia相比于Vuex的优势? 为什么要使用Pinia? Pinia的简单使用 安装(仅限于Vue3) 使用 概要 提示:下边是Pi ...
- [ 华为云 ] 云计算中Region、VPC、AZ 是什么,他们又是什么关系,应该如何抉择
前几天看到一个问答帖,我回答完了才发现这个帖子居然是去年的也没人回复,其中他问了一些华为云的问题,对于其中的一些概念,这里来总结讲解一下,希望对学习华为云的小伙伴有所帮助. 文章目录 区域(Regio ...
最新文章
- Windows Phone播放视频流
- 数据中心液冷技术发展分析
- linux aemv7,无法在我的Ubuntu machin中安装“xlwings”
- 详解:Sqoop的导入和导出数据
- 论一个蒟蒻的脑子里可以有多少坑(貌似咕了……目前更新保持在noip阶段)
- 网众无盘linux挂载u盘,个人总结出的49条网众无盘系统常见故障解决方法
- 修改配色 Mac电脑默认命令行工具(终端\terminal) MacBook Pro MacBook
- Java学习笔记(十)——开发个小项目(GoBang2.0)
- Roundpic:超简单的在线图片圆角处理~
- Android 支付宝sdk接入问题:不能唤起支付宝客户端,或者偶然唤起支付客户端
- C++/java设计模式汇总
- 【机器学习】sklearn机器学习入门案例——使用k近邻算法进行鸢尾花分类
- 规范使用计算机的ppt,2016年职称计算机PowerPoint操作练习题
- SQL: 第二高的薪水
- 视频文件头解析--mkv
- 数独求解:用c++做一个数独求解的程序(附源代码和.exe文件)
- 【日常Exception】第二十四回:nested exception is java.lang.NoClassDefFoundError: redis/clients/jedis/util/Pool
- C语言中 -> 是什么意思?
- Java学习资料分享
- 参与社团活动的意义_开展社团活动的意义
热门文章
- Java设计模式之迭代器模式
- JAVA构架之并发编程的一些总结
- Java性能优化方面的程序优化知识点归纳,希望对你有所帮助
- fanuc机器人编程手册_是谁需要G代码编程机器人?
- 超级外链工具_哪些SEO排名工具是有效的呢?
- Ubuntu下的Linux内核的编译及安装
- java 浏览器 爬虫_java 网络编程-爬虫+模拟浏览器
- endnote怎么改成中文版_毕业论文面对大量的参考文献标注,应该怎么办?(便捷整理的技巧和方法)...
- 各自然带代表植被_植被垂直带谱?水与热之间的较量。
- lisp对excel其他行列写入_【极简Python 自动化办公】Python写入Excel表格