随着公司业务的增多,云数据库 RDS 下的 MySQL 数据库的表越来越多,想要把它全部迁移到 MaxCompute 中进行计算分析,但又愁要配置太多次同步任务。如何能将大量的数据表一次性上传到 MaxCompute 中呢?通过大数据开发套件的整库迁移功能,便可快速完成 MySQL 数据整库迁移到 MaxCompute,从而节省同步时间,提高工作效率。

下面介绍一个适用于中小企业用户,高效率低成本的数据同步方案:

对于自建或云数据库 RDS 的 MySQL 数据库中的数据,都可以通过整库迁移功能,快速同步到 MaxCompute 中进行存储与分析,流程图如下:

云数据库 RDS :RDS 是一种稳定可靠、可弹性伸缩的在线数据库服务,本实验主要使用 云数据库 MySQL 版。

MaxCompute:原名 ODPS,是由阿里云自主研发的一款服务,提供针对TB/PB级数据、实时性要求不高的分布式处理能力,它适用于海量数据的存储、计算,商业智能等领域。

大数据开发套件:大数据开发套件提供全面托管的工作流服务,一站式开发管理的界面,帮助企业快速搭建数据中心。

实验目的和前期说明

实验目的:
通过大数据开发套件的整库迁移功能,快速把云数据库中的数据同步到 MaxCompute 中。

前期说明:
用户拥有阿里云官网实名认证账号,并且创建好账号 Access Key。

实验前的准备工作

开通并创建 MaxCompute 项目

1 . 阿里云实名认证账号访问 https://www.aliyun.com/product/odps ,根据自身需求进行购买,开通 MaxCompute;

2 . 点击开通成功页面的管理控制台,进入 MaxCompute 的 控制台页面;

3 . 创建项目。进入控制台页面后导航至 大数据开发套件 — 项目列表,点击 创建项目,如图所示:

4 . 在弹出框中选择区域和付费方式,输入项目名称:

准备同步数据

创建 RDS 实例

1 . 登录 RDS 管理控制台;
2 . 在 实例列表 页面,单击 新建实例,进入 创建 页面;
3 . 选择包年包月或按量付费,示例选择包年包月。关于计费方式的选择,请参见 收费项目及价格说明 中的计费方式;
4 . 根据自身需求选择基本配置、网络类型、规格、存储空间、购买时长和购买量等实例配置,详情请参见:创建实例中的选择实例配置;
5 . 单击立即购买,进入订单确认页面;
6 . 阅读关系型数据库 RDS 服务条款后,根据后续提示完成支付流程。

设置白名单

1 . 登录 RDS 管理控制台,选择目标实例;
2 . 在实例左侧菜单中选择 数据安全性
3 . 在数据安全性页面的默认分组后单击 修改,如下图所示:

4 . 在修改白名单分组页面删除默认白名单 127.0.0.1,填写自定义白名单后,单击 确定,如下图所示:

组内白名单:填写可以访问数据库的 IP 地址或者 IP 段,IP 地址或者 IP 段间用英文逗号分隔。详情请参见:设置白名单中的操作步骤。

创建账号和数据库

1 . 登录 RDS 管理控制台,选择目标实例;
2 . 选择左侧菜单中的 账号管理,单击 创建账号,如下图所示:

3 . 输入要创建的账号信息,单击 确定,如下图所示:

4 . 选择菜单中的 数据库管理,单击 创建数据库,如下图所示:

5 . 输入要创建的数据库信息,单击 确定,如下图所示:

登录数据库

进入数据库管理页面,点击上侧 登录数据库,在弹出页面填写数据库用户名和密码,如下图所示:

创建表并准备数据

1 . 成功登录数据库后,点击 SQL 操作下的 SQL 窗口,如下图所示:

2 . 输入建表语句,点击执行,示例如下:

 CREATE TABLE `a1`
(`id` int(11) NULL,`col1` varchar(32) NULL,`col2` varchar(32) NULL,`col3` varchar(32) NULL,`col4` varchar(32) NULL
)ENGINE=InnoDBDEFAULT CHARACTER SET=utf8 COLLATE=utf8_general_ci;

3 . 根据自身需求写入数据即可,insert 语句如下:

`INSERT INTO table_name(col_name,...) values(expr,...)`

整库迁移配置

新增数据源

1 . 登录到大数据开发套件 数据集成产品页,单击左侧导航栏离线同步—数据源,进入数据源管理页面,如下图所示:

2 . 点击右上角的 新增数据源,添加一个面向整库迁移的 MySQL 数据源 mysql_demo,填写相关信息,如下图所示:


各配置项的说明请参见:RDS 数据源配置之新建 RDS-MySQL 数据源。
3 . 点击 测试连通性 验证数据源访问正确无误后,确认并保存此数据源。

整库迁移

1 . 进入数据源列表页面,找到新增的数据源,点击对应 MySQL 数据源后的 整库迁移,即可进入对应数据源的整库迁移功能界面,如下图所示:

2 . 点击右上角 高级设置 按钮,您可以根据自身需求选择转换规则。比如 MaxCompute 端建表时统一增加了 ods_ 这一前缀,如下图所示:

3 . 根据自身需求选择需要迁移的数据表、同步方式、日期字段、同步并发配置、开始时间和同步数量,如下图所示:

4 . 点击 a1 表后对应的查看任务,会跳转到数据集成的任务开发界面。如下图所示:

由上图可以看到:源头 a1 表对应的 MaxCompute 表 ods_a1 创建成功,列的名字和类型也符合之前映射转换配置。在左侧目录树 mysql_demo 目录下,会有对应的所有整库迁移任务,任务命名规则是: mysql2odps 源表名,如上图红框部分所示。

5 . 此时便成功将一个 MySQL 数据源 mysql_demo 整库迁移到 MaxCompute 的工作。这些任务会根据配置的调度周期(默认天调度)被调度执行,您也可以使用 DataWorks DataIde 调度补数据功能完成历史数据的传输。

通过 数据集成-整库迁移功能 可以极大减少您初始化上云的配置、迁移成本。

【大数据新手上路】“零基础”系列课程--MySQL 数据整库迁移到 MaxCompute相关推荐

  1. python基础入门大作业怎么做_【百度飞桨】零基础Python课程大作业

    转眼间百度飞桨的零基础python课程马上就要结束了,所谓年前学python,年后来上号,通过本次课程可以对python有一个基础的认知和掌握,以下是大作业的个人代码,仅供参考. [作业一] #创建S ...

  2. 视频教程-SEO零基础实战课程+SEO快速盈利-网络营销

    SEO零基础实战课程+SEO快速盈利 专注搜索引擎优化,付费SEM推广 蒋惠杰 ¥1980.00 立即订阅 扫码下载「CSDN程序员学院APP」,1000+技术好课免费看 APP订阅课程,领取优惠,最 ...

  3. .NET Core 小程序开发零基础系列(2)——小程序服务通知(模板消息)

    基于上一篇文件".NET Core 小程序开发零基础系列(1)--开发者启用并校验牵手成功"的反映,个人觉得效果很不错,大家对公众号开发还是有很大需求的,同时也收到了很多同学的问题 ...

  4. AI大时代下,零基础进入人工智能领域该如何学习?

    在科技高速发展的今天,人工智能是一个很酷很潮的字眼,几乎每天都出现在科技媒体中,人工智能应用案例应接不暇:人工智能写稿取代编辑.人工智能医疗诊断取代医生.人工智能定投取代基金经理人.人工智能机器人取代 ...

  5. Java零基础系列003——变量

    Java零基础系列003--变量 //变量(variable):程序中最基本的存储单元,包括变量名.类型.作用域 //变量应该先声明,只有声明后系统才会为其分配相应长度的存储空间,变量实质上就是存储单 ...

  6. IT行业6大岗位最适合零基础入门的是这个,三个月上手

    IT行业6大岗位最适合零基础入门的是这个,三个月上手 \\\插播一条:我自己在今年年初录制了一套还比较系统的入门单片机教程,想要的同学找我(禾厶-亻言-手戈)免費的.最近比较闲,带做毕设,带学生参加省 ...

  7. Java零基础系列001——第一个程序

    Java零基础系列001--第一个程序 public class Welcome {public static void main(String[] args) {//args为arguments的缩 ...

  8. 0基础能学mysql数据库吗_mysql学习入门:零基础如何使用mysql创建数据库表?

    零基础如何自学Mysql创建数据库,是Mysql学习者必经之路,Mysql是受欢迎的关系数据库管理系统,WEB应用方面MySQL是很好的RDBMS应用软件之一.如何使用Mysql创建数据库表,打开My ...

  9. 大福利!Google机器学习零基础在线课程发布,免费!有中文版!

    作者 | Leo 新的学习资源来了!刚刚,谷歌上线了人工智能学习网站 Learn with Google AI,并推出了机器学习在线课程,免费!而且还有中文版! 传送门: "机器学习速成课程 ...

最新文章

  1. centos8 用u盘安装失败_玩转jenkins - 在自己的服务器上安装jenkins
  2. always@( )列表里不能同时有电平敏感事件和边沿触发事件
  3. sqlite 日期格式与排序问题
  4. 使用RichTextBox控件实现系统剪切板功能
  5. 带网格的_【我看身边的网格化】申港街道:一人一板穿梭楼宇小巷 一网一格解决百姓问题...
  6. flask报错 ValueError: Circular reference detected 问题解决
  7. C语言编写双人贪吃蛇游戏
  8. 微信开发者工具登录问题,网络连接失败
  9. 前端弹出对话框 js实现 ajax交互
  10. 《C++标准库》学习笔记 — STL —流
  11. 【自动化测试】Selenium IDE脚本编辑与操作(了解)
  12. 更改计算机用户名批处理,修改计算机名批处理
  13. 基于 JavaFX 开发的聊天客户端 OIM-即时通讯
  14. 分享 | NB-IoT智能井盖传感器
  15. SpringBoot笔记(四)其他框架介绍
  16. 微信小程序常用组件库收藏备用
  17. 分类模型的可视化评分技术
  18. 【飞项】定制你的专属日程管理管家拒绝行动的矮子
  19. zotero 使用方法
  20. 明伟LRS-350-24方案,送BOM表,原理图、PCB,可编辑。 以及结构图

热门文章

  1. SQLAlchemy 教程 —— ORM 方式使用示例
  2. Centos7 修改防火墙,开放端口、转发端口
  3. linux常用命令(精)
  4. 使用hexo创建blog
  5. C/C++:mongoose.c实现多表单域文件上传
  6. char,short ,int ,long,long long,unsigned long long数据范围
  7. Python sqlalchemy orm 多对多外键关联
  8. git使用记录_备忘
  9. Y2K Accounting Bug(poj2586)
  10. XML DTD用法【转载】