摘要:传统数据存储在线下数据中心,存在成本高、运维难、性能难保障等等多方面的问题。阿里云提供闪电立方、OSS/NASImport、混合云存储阵列、镜像回源、302跳转、伪源站等六大解决方案为企业提供不同场景的海量数据迁移解决方案。

存储和数据迁移的挑战
在传统企业服务中,大多数企业都是自建IDC,因此经常会遇到各种各样的问题,第一是成本高,机器成本、网络成本、人工成本,软件授权费用,公网内网费用,IDC租用费用等等。第二是运维很难,经常随着数据的积累,硬盘故障,服务器故障,网络故障,软件故障,IDC故障,用户投诉,整个运维难度成指数增加,体验非常差。第三是性能难保障,数据可靠性,服务可用性,功能先进性,安全性。随着业务的发展,以前的存储系统很难满足业务的发展、功能和性能的发展。因此向云迁移是数据存储的未来趋势。

 

阿里云存储有很全的产品家族,包含块存储、文件存储、对象存储、归档存储、表格存储等等。每一项都可以分很多子项。因此运维也不像以前那么难,可以做到代码改动上云、安全免运维(不用关注细节)、三步开通(开通-使用-付费)、一键备份等等,非常简洁方便。阿里云存储在全球有19个节点,可以做到全球写、全球读,目前在国内是最强的。

阿里云存储海量数据迁移解决方案
对于数据迁移来说,一般分为以下五个步骤:
1、评估现有的业务情况。做迁移之前,一定要把业务的情况了解清楚,比如:现有存储的总体IO、总吞吐、网络总带宽、已用带宽。
2、评估可用资源。存储集群可用吞吐、IO、可用稳定网络带宽、预留安全水位。
3、迁移前准备。根据评估状况制定迁移方案,计算需要的部署闪电立方Agent的集群数量和NASImport集群数量。
4、开始迁移。部署迁移集群,监测迁移状态,失败文件重试。
5、迁移结束。检查迁移文件数、校验迁移文件正确性。
在向云迁移海量数据的过程中,因为非结构化的存储比结构化的存储有更多的数据格式类型。对于非结构化的存储,没有办法知道有多少数据类型和文件系统,也有一些本地的大数据相关的对象存储,这样的对象存储,接口不一样,实现功能也不一样,因此对于非结构化的存储迁移需要更多的组合方案。阿里云提供了离线迁移的方案,叫闪电立方。同时也提供了海量数据在线迁移基于OSS/NASImport的在线迁移工具,针对不同的互联网产品,也提供了各种迁移服务,比如混合云存储阵列、镜像回源、302跳转、伪源站等等。下面分别介绍这六种解决方案。
在线迁移神器OSS/NASImport

 

Import工具是一款全在线的海量数据迁移工具,通过部署到服务器或者ECS机器,可以快速、安全稳定的将数据迁移到阿里云存储。它有如下特点:
1、支持多种源站,多种数据接口,可定制开发.
2、全在线服务,无缝迁移。
3、支持存量数据同步和增量数据自动同步。
4、支持断点续传,失败任务重传。
5、支持上传/下载流量控制。
6、支持多任务,并行数据下载/上传。
7、支持上传结果校验。
8、可视化监视界面。
离线迁移神器闪电立方

 

除了在线迁移之外,闪电立方是阿里云2017年发布的一款离线迁移神器,闪电立方实际上是一台服务器,它有如下特点:
1、军工级物流密码保护箱。
2、双控制器,支持双电源。
3、企业级SAS硬盘,Raid6数据保护。
4、AES256 对称加密,MAC认证。
5、客户保管密码 SHA256(可选)。
6、支持压缩去重。
7、确认迁移完成后,数据合规擦除。
8、单套支持每次迁移480TB。
闪电立方就像一个超大的U盘,可以直接把闪电立方插到机房,然后把数据迁移到闪电立方,再通过专业传输物流上传到阿里云机房即可迁移成功。
混合云存储阵列

 

OSS/NASImport和闪电立方这两种方案基本上在数据迁移之后,企业会放弃自己的机房,然而对于想混合使用的原有机房和云上资源的情况下,阿里云也有解决方案,就是使用混合云阵列,使用场景有企业数据云端拓展、企业数据云端同步、备份数据云端异地灾备等。它的核心功能是提供丰富的设备端协议支持,原有应用无需修改,提供端到端的数据加密机制,数据自动分层,高性能的数据上云能力。有缓存和同步两种模式,数据支持端到端的压缩、去重、加密,还支持多版本快照、数据自动分层。
OSS镜像回源

 

另外有一些互联网业务,完全不能停机迁移的,阿里云也提供两种迁移方案,第一个是OSS镜像回源,功能是把所有的访问先切到OSS上面,然后配置好镜像回源的地址,用户访问OSS的时候,OSS会主动回源到主站。
302跳转
另外一种方案,不需要把所有数据迁移到OSS数据,比如热点数据,我们提供302跳转功能。当用户通过CDN访问OSS的时候,即使OSS没有数据,只要打开302跳转功能并且配置好回源地址,OSS会主动的把回源地址返回给CDN,然后CDN会拿到地址再回源到源站拿到数据返回给用户。这两种是完全在线迁移,对互联网业务和增量数据迁移是非常好用的。
伪源站

 

如果企业有多个源站,可以使用伪源站在线迁移,把伪源站和真正的源站进行隔离,由伪源站去拿数据。伪源站相当于替代源站,去把所有的业务处理完以后,再把数据上传到OSS,这在互联网业务分发应用的非常广泛。

 

以上介绍的6个方案适用于不同的应用场景。对于非结构化的数据来说,数据类型太多、数据量大小也不一样。例如像闪电立方,最适合做离线迁移,即使数据量上百TB,但前置条件是本地IDC要有足够的内网带宽和机架提供给闪电立方。例如像镜像回源,用户访问OSS的时候,如果文件特别大,再去源站拿数据的时候,访问速度就会非常慢,所以镜像回源适合小规模的文件迁移,例如图片、短视频等等。

客户实践

 

某企业业务全是互联网业务,经过日积月累,数据已经达到上百TB,并且数据中心分布的非常广,在各地都有,而且每个数据中心网络条件不一样,存储机器也不一样,所以非常纠结是不是需要上云。阿里云给客户做了一套比较完善的“离线+在线+互联网”迁移方案。因为他们的IDC机器非常老,网络环境又恶劣,没法跟OSS专线连通,成本过高,硬件支持不了这么大的带宽,所以阿里云做了一套闪电立方的专业迁移方案,多批次的搬迁。当第一批闪电立方上架之后,第二批马上准备,在第一批迁移完之后,第二批马上开始,基本上做到了每分每秒都在迁移,跟在线迁移同时完成。在迁移的过程中,也产生了一批增量数据,通过增量数据回源的方法,把增量数据也迁移进去。这是一个大型互联网公司数据迁移上云方案。

 

另一个案例是一个传统的三甲医院的数据迁移方案,他们的存储机还在用,并且希望迁移过程中产生的增量数据只迁移一部分。阿里云也制定了一套完整的方案,其中关键点在于把客户所有的本地数据,通过闪电立方存储到OSS,再同时把混合云存储阵列部署到客户的机房,把剩余的增量数据同步到OSS里面。因为数据不是特别大,一个星期之内就迁移完了。目前,该上云的数据就上云,该在线下的数据依然存储在线下,自己的应用一点都不用改变。

 

在存储迁移这个领域,阿里云积累了大量的经验。阿里云存储服务客户的数据达到了10EB以上,为100PB以上的客户从线下迁移到阿里云OSS,最多一天迁移5PB的数据。阿里云的迁移方案接口丰富、性能强大、稳定可靠、安全高效,支持在线、离线、纯互联网、传统企业的混合云模式进行迁移,将来会有越来越多的客户会把线下的数据迁移到阿里云存储。

本文由云栖志愿小组黄小凡整理

上云迁移-海量数据迁移解决方案相关推荐

  1. 怎么将网站迁移到云服务器上,云服务器网站迁移到虚拟主机

    云服务器网站迁移到虚拟主机 内容精选 换一换 华为云帮助中心,为用户提供产品简介.价格说明.购买指南.用户指南.API参考.最佳实践.常见问题.视频帮助等技术文档,帮助您快速上手使用华为云服务. 使用 ...

  2. oracle外部表迁移,海量数据迁移之外部表并行抽取

    在10g开始的新特性中,外部表是一个不容忽视的好工具.对于大型项目中海量数据使用sqlloader是一种全新的方式,不过很明显,sqlloader的可扩展性更强,但是基于oracle平台的数据迁移来说 ...

  3. 天翼云从业认证(4.1)上云迁移实战

    了解天翼云服务器迁移工具的产品功能.产品优势.应用场景和操作流程: 天翼云服务器迁移工具 服务器迁移工具(CT-SMT Server Migration Tool)是天翼云为上云用户量身打造的零停机的 ...

  4. 成中集团线下IDC迁移上云

    阿里云根据成中集团业务场景入手,提供了上云方案和迁移建议,利用这套架构,保障了公司数据的安全性并且满足了公司对于备份机制的建立的基本诉求,并且降低了业务出现中断的风险. 公司介绍 成中简介: 我们公司 ...

  5. 蓝云公布2019云生态战略,如何解决企业上云关键问题?

    过去几年,云计算在发展过程中暴露出很多问题,比如云厂商推进步伐很快,但企业接受能力有限,导致不少企业的云初体验并不是很愉快,未能最大化利用云平台的价值造成大量资源浪费,进而产生云平台成本很高的印象-这 ...

  6. 推动企业上云实施经验总结

    当下,一场以IT技术为主角的科技革命浪潮正风起云涌.云计算.大数据.人工智能.物联网.区块链等新技术正加速应用落地.在这些新技术当中,云计算作为基础设施,它是这场科技革命的承载平台,全面支撑着各类新技 ...

  7. 我的一点企业上云经验

    作者按:日前,工信部印发<推动企业上云实施指南(2018-2020年)>,其中指出:到2020年,力争实现企业上云环境进一步优化,行业企业上云意识和积极性明显提高,上云比例和应用深度显著提 ...

  8. 企业应用上云有捷径?“五段式”方法论来引路

    如今无论是传统行业还是互联网公司,都在激烈竞争市场主导权,如何实现快速盈利.提高员工效率.增强用户体验--这些都是CXO们十分关心的问题.对于现代企业环境而言,一个企业的"IT DNA&qu ...

  9. 亚马逊云科技数据库的五大核心理念,为企业上云发展助阵

    数据智能产业创新服务媒体 --聚焦数智 · 改变商业 近日,走过十个年头的亚马逊re:Invent大会今年落下帷幕,亚马逊云科技发布了包括云数据库在内的一系列重塑未来的创新技术与服务,并邀请全球各行各 ...

最新文章

  1. CVPR2020论文解读:手绘草图卷积网络语义分割
  2. reactjs脚手架配置http-proxy-middleware代理解决跨域问题
  3. JVM-Java内存区域
  4. (1)memcached应用
  5. linux安装x11鼠标主题
  6. “约见”面试官系列之常见面试题之第一百零四篇之vue优点(建议收藏)
  7. 为什么玩我的世界老提示Java se错误_我的世界error错误信息 error could解决方法
  8. 【项目管理】项目进度管理的关键路径
  9. Luogu P1311 选择客栈(前缀和)
  10. sharepoint_study_5
  11. pyqt5 窗口设置圆角_pyqt5-30. QWidget设置圆角,使用qss设置失败
  12. php调京东联盟接口,使用京东联盟API获取自定义促销链接
  13. 摇杆控制方向原理_摇杆电位器结构及工作原理详解
  14. android 主流分辨率是多少,android手机常用分辨率有哪些?
  15. 当职场中领导问是否有男朋友要怎么应对
  16. Diffusion Models专栏文章汇总:入门与实战
  17. 49个学习Python的国外资源
  18. Kali Linux渗透测试——WEB渗透(一)
  19. windwos下启动Redis或者Sentinel报错【listen:Unknown error】的原因及解决办法
  20. Vue学习—深入剖析vue-cli脚手架(一)

热门文章

  1. 全球及中国石墨烯行业发展格局及投资盈利分析报告2021年版
  2. 风寒感冒与风热感冒的区分与治疗
  3. 高级用户 java_java高级-基本
  4. MySql中的运算符
  5. 熟悉一下oncontextmenu事件的知识
  6. JavaScript开发
  7. IntelliJ - idea15.0.2 破解方法
  8. 使用ajax进行汽车详情表的查询
  9. [cocoapods]安装cocoapods
  10. ios JSON 解析流程(转)