BI系统AWS云迁移方案设计(通用)
背景:为一家大型企业本地化BI系统做上云迁移的总体方案。客户对当前本地的BI系统不满意,希望迁移到AWS云之后,能够重新用Tableau做新的BI报表设计。所以这不是本地系统的平滑迁移,而是需要在云上重建BI系统的优化迁移。因此,主要内容是BI数据的迁移,利用AWS原生服务和生态厂商服务重建数据仓库和BI报表,并保留本地其他业务系统的联系和数据源。
业务需求
- 客户公司为了匹配整体业务上云策略,计划将当前BI系统迁移至AWS公有云;
- 当前客户本地BI系统数据包含3种模型 (IMS ,CPA ,Sales);
当前整体数据架构
GODW(Global Oracle Data Warehouse)分为两步处理,ETL7.1和ETL7.2:
ETL7.1:从数据源中提取数据做处理,构建ODS
ETL7.2:根据企业定义标准,转换和加载数据到数据仓库
企业当前BI系统
- 数据仓库: GODW (Global Oracle Data Warehouse)
- ETL 工具: Informatica PowerCenter 10.1.1 HF2
- Report 工具: Tableau 2018.1.4
- 数据源: FlatFiles and SQL Server
迁移后的解决方案
- 数据仓库: AWS Redshift and S3
- ETL 工具 : Informatica PowerCenter / Informatica Intelligent Cloud Services
- Report 工具 : Tableau 2018.1.4
- 数据源: FlatFiles, SQL Server and GODW
迁移方案的范围
- 现有的数据ETL处理过程迁移至AWS
- 现有GODW数据和历史数据备份迁移至AWS
- 在AWS上利用Redshift开发新的DW
- 基于AWS Redshift数据仓库构建新的BI报表
迁移过程
阶段1:
工作内容 |
工具 |
输出 |
|
调研与评估阶段 |
1.业务需求范围锁定: 需求收集; 业务关系识别与描述 |
•应用发现服务(ADS) 用于识别高保真、实时的应用状况以及依赖关系; •模式转换工具 (SCT) 用于评估当前数据结构和转换数据架构 |
现有系统评估和分析报告 |
2. 需求评估: • ETL 方法; •表结构; •数据模型; •依赖关系; •数据量; •敏感数据; •安全等级 |
阶段2:
工作内容 |
工具 |
输出 |
|
设计和规划阶段 |
1.系统设计: 包括AWS IAM账号体系设计,数据注入和流向设计,AWS资源选择,安全和扩展性部署规划; 2. 云上ETL过程和数据模型设计; 3. Tableau 报表设计 |
•AWS 数据库迁移服务 (DMS), 模式转换工具SCT将数据从 GODW 至 AWS Redshift转换; •安全专线连接; •RedShift数据仓库服务 •第三方Tableau工具 |
系统架构设计;报表设计;迁移计划和指导书 |
4. 迁移规划: •批量历史数据迁移和增量数据迁移; •工具选择; •数据量,网速和时间成本估算; •风险评估和应对措施,以及回滚方案 |
目标解决方案设计--从GODW到AWS的数据流:
- 源数据应该通过DMS从本地迁移到S3的存储桶。DMS支持批量数据迁移和增量数据迁移,ETL日志也可以发送到S3存储。
- Informatica EC2主机将处理从登陆S3桶到模型S3桶的过程(在AWS中)。
- 处理后的数据保存到模型S3桶中。
- 从S3模型桶中加载数据到Redshift DW服务中。
- Tableau Server用于生成基于Redshift数据的模型报表。
阶段3:
工作内容 |
工具 |
输出 |
|
执行实施阶段 |
1.AWS 资源准备; 2.专线连接准备; 3.最小化操作设置和验证:在一致同意的部分用例上,使用已确认的AWS原厂服务、数据模型和前端可视化交付; 4.集成测试与验证; 5.验证通过后,进行总体系统迁移和部署 |
•AWS 数据库迁移服务 (DMS), 模式转换工具SCT将数据从 GODW 至 AWS Redshift转换; •安全专线连接; •RedShift数据仓库服务 •S3, EC2, Informatica |
迁移结果 |
阶段4:
工作内容 |
工具 |
输出 |
|
BI 报表开发和投入生产 |
1.在AWS上开发新的BI系统,使用Tableau工具和报表可视化; 2.验收测试 3.修改DNS使BI服务割接到AWS新系统 4.提供操作和监视/维护服务2周 |
Redshift, Informatica, Tableau |
在AWS运行的生产系统 |
假设
- 客户提供经过清洗的干净的数据(将用作ETL和生成报表的源)
- POV将使用云原生服务
- 一个简单的数据模型将作为这个POV的作用域(例如 Sales)。
- 用Tableau开发基于AWS的报表
项目计划
根据项目实际周期预估和约束做出合理计划:
如需进一步获取详细AWS云业务方案或者其他云迁移咨询方案,请在评论区留言与作者讨论。
BI系统AWS云迁移方案设计(通用)相关推荐
- 云架构师进阶【SAP迁移方案设计】手把手教您玩转SAP上云
一,项目背景介绍 今天又接到了北京某制造企业SAP迁移的场景,先简单说明一下,好好的SAP在运行着为什么要做迁移这类大动作呢?众所周知SAP的ERP是企业的绝对核心系统,尤其对于制造业更是核心的系统, ...
- Oracle数据库迁移到AWS云的方案
转载:http://www.cnblogs.com/allcloud/p/6148513.html 当前云已经成为常态,越来越多的企业希望使用云来增加基础设施的弹性.减轻基础设施的维护压力,运维的成本 ...
- AWS数据迁移华为云方案
介绍 绝大多数企业迁移上云,主要需要的迁移数据为主机数据和数据库数据,而各家云厂商为了更好的争取到客户,方便客户迁移上云,都有一些迁移工具,主机迁移工具实现原理主要是通过P2V和V2V的方式,数据库迁 ...
- aws mysql 迁移_Amazon DMS 数据库迁移_数据迁移_云迁移-AWS云服务
使用案例 同构数据库迁移 在同构数据库迁移中,源数据库和目标数据库采用相同或兼容的数据库引擎,例如从 Oracle 迁移至 Amazon RDS for Oracle.从 MySQL 迁移至 Amaz ...
- redis 迁移工具 redis-port 从阿里云迁移到aws
对于 redis 的 迁移我在网上看到了很多方法,有使用redis-dump 的,有使用 aof导入方式,有rdb文件迁移方式,和redis-port. 由于我是将 redis 从阿里云迁移到AW ...
- HyperMotion云迁移助力中国联通,青云完成某央企上云项目,加速该集团核心业务系统上云进程
项目概述 某大型集团业务涉猎广泛,新业务不断增加,数据增长成GB量级,但IT架构老化,响应缓慢迟钝,架构调整困难重重,多种系统运维难度大,无法统一管理优化,对新业务的无法高效支撑,容量和性能不能弹性供 ...
- aws 数据库迁移_将您的sql数据库迁移到云AWS和Azure
aws 数据库迁移 When migrating your SQL databases to the cloud you need to make your choice carefully. Mig ...
- MAC 通过终端连接AWS云服务上的linux系统(Ubuntu)修改Html的标题
先看结果截图 作业完成要求:(个人作业仅供参考) 方法:MAC 通过终端 连接AWS云服务上的linux系统(Ubuntu)修改Html的标题(修改成自己的名字) 1.直接进入课程地址:https:/ ...
- 阿里云——云迁移中心
简介 云迁移中心(Cloud Migration Hub,简称CMH)是阿里云自主研发的一站式迁移平台.为广泛用户的迁移上云项目提供自动与智能的系统调研,云上规划,迁移管理,简化和加速用户上云过程,辅 ...
- 【AWS云从业者基础知识笔记】——模块5:存储和数据库
01介绍 学习目标 总结存储和数据库的基本概念. 描述Amazon Elastic Block Store (Amazon EBS)的好处. 描述Amazon Simple Storage Servi ...
最新文章
- mysql是逻辑库吗_mycat是一种比较简单的中间件产品,可以帮助mysql进行分库,同时统一在一个逻辑库。硬件环境:系统:centos 7.6数据库版本:5.7.19mycat:...
- 技巧/诀窍:在ASP.NET中重写URL
- vim程序编译器使用(整理)
- Cisco二层交换机命令
- 创造11,你pick哪位讲师?
- linux lvs 存储层,LVS集群配置之LVS介绍
- java验证邮件正则
- 金蝶K3常用数据表(整理)
- 美萍系统怎么修改服务器时间,局域网中如何架设美萍VOD视频点播系统服务器
- java角色权限设计
- docker制作alpine-kod镜像
- SQL Server数据库的创建方法
- c语言 strcpy作用,c语言中的strcpy什么意思,简单点解释
- 【容器】Podman容器快速上手
- 关于Linux系统重启过慢问题解决方案
- HDU 2061-2080
- 人性21——离奇自杀案
- QSound一句代码播放简单的音效
- mysql之表与表之间的关系
- 如何用MASM5.0 (图解)
热门文章
- 数字图像学笔记——8. 几种常见的空间滤波器(均值滤波器、中值滤波器)
- MyBatis创建视图
- c语言程序设计50例(经典收藏),C语言程序设计50例(经典收藏)
- 30个外贸业务员常用邮件模板案例分享
- 为什么国内动漫制作多为3D动漫?3DMAX制作次时代建模主要是因为?
- 详介 MQTT 服务器的搭建与客户端连接
- 分布式常见面试题总结(2021)
- 前程无忧岗位数据爬取+Tableau可视化分析
- 手游自动挂机脚本开发历程
- VC++6.0下编译xvidcore1.1.0