背景:为一家大型企业本地化BI系统做上云迁移的总体方案。客户对当前本地的BI系统不满意,希望迁移到AWS云之后,能够重新用Tableau做新的BI报表设计。所以这不是本地系统的平滑迁移,而是需要在云上重建BI系统的优化迁移。因此,主要内容是BI数据的迁移,利用AWS原生服务和生态厂商服务重建数据仓库和BI报表,并保留本地其他业务系统的联系和数据源。

业务需求

  • 客户公司为了匹配整体业务上云策略,计划将当前BI系统迁移至AWS公有云;
  • 当前客户本地BI系统数据包含3种模型 (IMS ,CPA ,Sales);

当前整体数据架构

GODW(Global Oracle Data Warehouse)分为两步处理,ETL7.1和ETL7.2:

ETL7.1:从数据源中提取数据做处理,构建ODS

ETL7.2:根据企业定义标准,转换和加载数据到数据仓库

企业当前BI系统

  • 数据仓库: GODW (Global Oracle Data Warehouse)
  • ETL 工具: Informatica PowerCenter 10.1.1 HF2
  • Report 工具: Tableau 2018.1.4
  • 数据源: FlatFiles and SQL Server

迁移后的解决方案

  • 数据仓库: AWS Redshift and S3
  • ETL 工具 : Informatica PowerCenter / Informatica Intelligent Cloud Services
  • Report 工具 : Tableau 2018.1.4
  • 数据源: FlatFiles, SQL Server and GODW

迁移方案的范围

  • 现有的数据ETL处理过程迁移至AWS
  • 现有GODW数据和历史数据备份迁移至AWS
  • 在AWS上利用Redshift开发新的DW
  • 基于AWS Redshift数据仓库构建新的BI报表

迁移过程

阶段1:

工作内容

工具

输出

调研与评估阶段

1.业务需求范围锁定:

需求收集;

业务关系识别与描述

•应用发现服务(ADS) 用于识别高保真、实时的应用状况以及依赖关系;

•模式转换工具 (SCT) 用于评估当前数据结构和转换数据架构

现有系统评估和分析报告

2. 需求评估:

• ETL 方法;

•表结构;

•数据模型;

•依赖关系;

•数据量;

•敏感数据;

•安全等级

阶段2:

工作内容

工具

输出

设计和规划阶段

1.系统设计:

包括AWS IAM账号体系设计,数据注入和流向设计,AWS资源选择,安全和扩展性部署规划;

2. 云上ETL过程和数据模型设计;

3. Tableau 报表设计

•AWS 数据库迁移服务 (DMS), 模式转换工具SCT将数据从 GODW 至 AWS Redshift转换;

•安全专线连接;

•RedShift数据仓库服务

•第三方Tableau工具

系统架构设计;报表设计;迁移计划和指导书

4. 迁移规划:

•批量历史数据迁移和增量数据迁移;

•工具选择;

•数据量,网速和时间成本估算;

•风险评估和应对措施,以及回滚方案

目标解决方案设计--从GODW到AWS的数据流:

  1. 源数据应该通过DMS从本地迁移到S3的存储桶。DMS支持批量数据迁移和增量数据迁移,ETL日志也可以发送到S3存储。
  2. Informatica EC2主机将处理从登陆S3桶到模型S3桶的过程(在AWS中)。
  3. 处理后的数据保存到模型S3桶中。
  4. 从S3模型桶中加载数据到Redshift DW服务中。
  5. Tableau Server用于生成基于Redshift数据的模型报表。

阶段3:

工作内容

工具

输出

执行实施阶段

1.AWS 资源准备;

2.专线连接准备;

3.最小化操作设置和验证:在一致同意的部分用例上,使用已确认的AWS原厂服务、数据模型和前端可视化交付;

4.集成测试与验证;

5.验证通过后,进行总体系统迁移和部署

•AWS 数据库迁移服务 (DMS), 模式转换工具SCT将数据从 GODW 至 AWS Redshift转换;

•安全专线连接;

•RedShift数据仓库服务

•S3, EC2, Informatica

迁移结果

阶段4:

工作内容

工具

输出

BI 报表开发和投入生产

1.在AWS上开发新的BI系统,使用Tableau工具和报表可视化;

2.验收测试

3.修改DNS使BI服务割接到AWS新系统

4.提供操作和监视/维护服务2周

Redshift,

Informatica,

Tableau

在AWS运行的生产系统

假设

  • 客户提供经过清洗的干净的数据(将用作ETL和生成报表的源)
  • POV将使用云原生服务
  • 一个简单的数据模型将作为这个POV的作用域(例如 Sales)。
  • 用Tableau开发基于AWS的报表

项目计划

根据项目实际周期预估和约束做出合理计划:

如需进一步获取详细AWS云业务方案或者其他云迁移咨询方案,请在评论区留言与作者讨论。

BI系统AWS云迁移方案设计(通用)相关推荐

  1. 云架构师进阶【SAP迁移方案设计】手把手教您玩转SAP上云

    一,项目背景介绍 今天又接到了北京某制造企业SAP迁移的场景,先简单说明一下,好好的SAP在运行着为什么要做迁移这类大动作呢?众所周知SAP的ERP是企业的绝对核心系统,尤其对于制造业更是核心的系统, ...

  2. Oracle数据库迁移到AWS云的方案

    转载:http://www.cnblogs.com/allcloud/p/6148513.html 当前云已经成为常态,越来越多的企业希望使用云来增加基础设施的弹性.减轻基础设施的维护压力,运维的成本 ...

  3. AWS数据迁移华为云方案

    介绍 绝大多数企业迁移上云,主要需要的迁移数据为主机数据和数据库数据,而各家云厂商为了更好的争取到客户,方便客户迁移上云,都有一些迁移工具,主机迁移工具实现原理主要是通过P2V和V2V的方式,数据库迁 ...

  4. aws mysql 迁移_Amazon DMS 数据库迁移_数据迁移_云迁移-AWS云服务

    使用案例 同构数据库迁移 在同构数据库迁移中,源数据库和目标数据库采用相同或兼容的数据库引擎,例如从 Oracle 迁移至 Amazon RDS for Oracle.从 MySQL 迁移至 Amaz ...

  5. redis 迁移工具 redis-port 从阿里云迁移到aws

    对于 redis 的 迁移我在网上看到了很多方法,有使用redis-dump 的,有使用 aof导入方式,有rdb文件迁移方式,和redis-port. 由于我是将  redis  从阿里云迁移到AW ...

  6. HyperMotion云迁移助力中国联通,青云完成某央企上云项目,加速该集团核心业务系统上云进程

    项目概述 某大型集团业务涉猎广泛,新业务不断增加,数据增长成GB量级,但IT架构老化,响应缓慢迟钝,架构调整困难重重,多种系统运维难度大,无法统一管理优化,对新业务的无法高效支撑,容量和性能不能弹性供 ...

  7. aws 数据库迁移_将您的sql数据库迁移到云AWS和Azure

    aws 数据库迁移 When migrating your SQL databases to the cloud you need to make your choice carefully. Mig ...

  8. MAC 通过终端连接AWS云服务上的linux系统(Ubuntu)修改Html的标题

    先看结果截图 作业完成要求:(个人作业仅供参考) 方法:MAC 通过终端 连接AWS云服务上的linux系统(Ubuntu)修改Html的标题(修改成自己的名字) 1.直接进入课程地址:https:/ ...

  9. 阿里云——云迁移中心

    简介 云迁移中心(Cloud Migration Hub,简称CMH)是阿里云自主研发的一站式迁移平台.为广泛用户的迁移上云项目提供自动与智能的系统调研,云上规划,迁移管理,简化和加速用户上云过程,辅 ...

  10. 【AWS云从业者基础知识笔记】——模块5:存储和数据库

    01介绍 学习目标 总结存储和数据库的基本概念. 描述Amazon Elastic Block Store (Amazon EBS)的好处. 描述Amazon Simple Storage Servi ...

最新文章

  1. mysql是逻辑库吗_mycat是一种比较简单的中间件产品,可以帮助mysql进行分库,同时统一在一个逻辑库。硬件环境:系统:centos 7.6数据库版本:5.7.19mycat:...
  2. 技巧/诀窍:在ASP.NET中重写URL
  3. vim程序编译器使用(整理)
  4. Cisco二层交换机命令
  5. 创造11,你pick哪位讲师?
  6. linux lvs 存储层,LVS集群配置之LVS介绍
  7. java验证邮件正则
  8. 金蝶K3常用数据表(整理)
  9. 美萍系统怎么修改服务器时间,局域网中如何架设美萍VOD视频点播系统服务器
  10. java角色权限设计
  11. docker制作alpine-kod镜像
  12. SQL Server数据库的创建方法
  13. c语言 strcpy作用,c语言中的strcpy什么意思,简单点解释
  14. 【容器】Podman容器快速上手
  15. 关于Linux系统重启过慢问题解决方案
  16. HDU 2061-2080
  17. 人性21——离奇自杀案
  18. QSound一句代码播放简单的音效
  19. mysql之表与表之间的关系
  20. 如何用MASM5.0 (图解)

热门文章

  1. 数字图像学笔记——8. 几种常见的空间滤波器(均值滤波器、中值滤波器)
  2. MyBatis创建视图
  3. c语言程序设计50例(经典收藏),C语言程序设计50例(经典收藏)
  4. 30个外贸业务员常用邮件模板案例分享
  5. 为什么国内动漫制作多为3D动漫?3DMAX制作次时代建模主要是因为?
  6. 详介 MQTT 服务器的搭建与客户端连接
  7. 分布式常见面试题总结(2021)
  8. 前程无忧岗位数据爬取+Tableau可视化分析
  9. 手游自动挂机脚本开发历程
  10. VC++6.0下编译xvidcore1.1.0