摘要: 对于创业成长型的企业来说,离线计算已经必不可少了,通过离线计算我们可以生成复杂的业务报表,通过离线计算我们也能精确的算出用户画像。离线计算已经当今的企业中成为了不可或缺的存在。那么使用弹性计算能够对离线计算领域带来什么好处呢?本文将介绍如何使用弹性计算节省企业离线计算成本。

背景

对于目前创业成长型的企业来说,离线计算已经必不可少了,通过离线计算我们可以生成复杂的业务报表,通过离线计算我们也能精确的算出用户画像。离线计算已经当今的企业中成为了不可或缺的存在。那么使用弹性计算能够对离线计算领域带来什么好处呢?小编告诉你好处肯定是有的,且听小编娓娓道来。

常见离线计算架构

从上图中我们用最常见的离线计算开源产品Hadoop作为例子,如上图所示大家会把存储服务跟计算符合放在一台ECS上。但是随着业务的扩张,我们对计算的需求越来越大,我们需要用数据做各种运算,为了增强离线集群的计算能力,我们会想到直接通过添加计算节点的方式来获得。但是随着计算节点的添加我们会遇到另一个问题,那就是资源利用率不够的问题。虽然计算通过扩容能够提升计算能力,但是数据可不会像计算那样突然猛增,所以对于存储来说扩容操作会暂时导致资源利用率的下降。再加上离线计算每天的计算时间只有一段时间,扩容之后的ECS在每天离线计算完成之后将大量空闲,这段时间将是对成本极大的浪费!那么很多客户会想是否有一种方法能够将计算存储分开进行扩容,并且在离线计算的时候对计算节点扩容,在计算完成之后将扩容的计算节点释放掉,从而达到节省成本的目的。这个架构肯定是有的,不过为了让大家更好的理解接下来的架构,小编先要给大家介绍一下竞价实例和弹性伸缩。

竞价实例简单介绍

从上面的图中大家可以发现竞价实例是一种按照供需关系变化价格波动的一种后付费类型实例,相对于按量付费实例价格有较低的折扣。不过同时竞价实例是有可能随时被阿里云释放的,这点请大家务必注意。简而言之就是竞价实例便宜,但是可能随时被释放。

弹性伸缩简单介绍

弹性伸缩总共有如下三个优点:

提升容错能力

弹性伸缩会定时检查ECS健康状态,如果发现ECS不健康,那么ECS将会创建一台新的ECS去替换它并且将不健康的ECS释放掉。

增强可用性

弹性伸缩能够通过定时、自动伸缩保证应用程序始终有合适的容量去满足当前的请求流量。

优化成本

弹性计算通过自动动态的方式按需增减实例,在需要的时候添加实例,不需要的时候释放实例,从而节约IT成本。

存储计算分离之后的离线计算架构

经过上面对竞价实例以及弹性伸缩简单的介绍,现在小编可以大声的告诉大家,存在一种基于弹性计算的架构能够不仅能够满足用户对于海量数据的计算能力需求,而且还能降低大家的计算成本。

  • 将Hadoop的存储计算节点分离
  • 使用弹性伸缩来按时、按需创建、释放计算计算节点
  • 计算节点的付费类型采用竞价方式

这里相信大家肯定又有疑问了,竞价实例不是会被阿里云释放吗,这里使用竞价实例合适吗?答案是绝对合适的。第一竞价实例的价格变量付费便宜很多,第二就算竞价实例被阿里云释放了,影响的也紧紧只是我们离线计算的速度。在上面的架构图上小编也留了一台ECS没有加入伸缩组,这一台ECS我们可以采用预付费的方式为我们计算资源提供“保底”的计算能力,当然我们也可以根据自身的需要来设置“保底”ECS的数量。

使用竞价实例+弹性伸缩搭建离线计算架构Tips

Spot Instance出价策略

通过阿里云ECS的售卖页面查看竞价实例多可用区的历史价格,从而选择一个合理的出价。

AutoScaling伸缩组配置

  • 不要在整点触发定时扩容任务,整点扩容的客户比较多,大家可以选择整点过后5-10分钟进行扩容,这样价格相对会低一些
  • 通过监测计算节点的CPU/MEM指标来触发报警任务
  • 通过在伸缩组选择多可用区来增加成功购买竞价实例的概率
  • 在伸缩组内配置最大ECS数目防止弹性伸缩创建ECS数量超过预期
  • 创建一条伸缩任务进行手动扩容以备不时之需

使用Spot Instance + AutoScaling成本

原文链接

干货好文,请关注扫描以下二维码:

离线计算成本节省的神兵利器相关推荐

  1. 降低 Spark 计算成本 50.18 %,使用 Kyligence 湖仓引擎构建云原生大数据底座,为计算提速 2x

    2023 中国开源未来发展峰会于 5 月 13 日成功举办.在大会开源原生商业分论坛,Kyligence 解决方案架构高级总监张小龙发表<云原生大数据底座演进 >主题演讲,向与会嘉宾介绍了 ...

  2. 基于Hadoop的58同城离线计算平台设计与实践

    作者:余意,来自:DataFun 导读:58离线计算平台基于 Hadoop 生态体系打造,单集群4000+台服务器,数百 PB 存储,日40万计算任务,面临挑战极大.58大数据平台的定位主要是服务数据 ...

  3. 基于 Hadoop 的58同城离线计算平台设计与实践

    导读:58离线计算平台基于 Hadoop 生态体系打造,单集群4000+台服务器,数百 PB 存储,日40万计算任务,面临挑战极大.58大数据平台的定位主要是服务数据业务开发人员,提高数据开发效率,提 ...

  4. 58同城离线计算平台设计与实践

    分享嘉宾:余意 58同城 高级架构师 编辑整理:史士博 内容来源:58大数据系列直播 出品平台:DataFun 导读:58离线计算平台基于 Hadoop 生态体系打造,单集群4000+台服务器,数百 ...

  5. 58同城离线计算平台设计与实践(大数据进阶)

    编者荐语: 58离线计算平台基于 Hadoop 生态体系打造,单集群4000+台服务器,数百 PB 存储,日40万计算任务,面临挑战极大.本次分享将聚焦大数据平台离线计算和大家一起系统的探讨58在离线 ...

  6. 离线计算中的幂等和DataWorks中的相关事项

    摘要: 概念 幂等这个词在软件研发中经常被提到.比如消息发送时不应该同时给同个用户推送多次相同的消息,针对同一笔交易的付款也不应该在重试过程中扣多次钱.曾见过一个案例,有个对于一个单据的确认模块没有考 ...

  7. OPPO大数据离线计算平台架构演进

    1 前言 OPPO的大数据离线计算发展,经历了哪些阶段?在生产中遇到哪些经典的大数据问题?我们是怎么解决的,从中有哪些架构上的升级演进?未来的OPPO离线平台有哪些方向规划?今天会给大家一一揭秘. 2 ...

  8. 离线计算平台在汽车之家的演进之路

    本次的分享内容分成四个部分: 1.汽车之家离线计算平台现状 2.平台构建过程中遇到的问题 3.基于构建过程中问题的解决方案 4.离线计算平台未来规划 ▌汽车之家离线计算平台现状 1. 汽车之家离线计算 ...

  9. 【最新】如何降低深度强化学习研究的计算成本(Reducing the Computational Cost of DeepRL)...

    深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 人们普遍认为,将传统强化学习与深度神经网络相结合的 ...

最新文章

  1. 卫星导航技术主要应用领域有哪些?
  2. python基本用法_python基本用法
  3. 《众妙之门——Web用户体验设计与可用性测试》一2.3 总结
  4. 中心信令服务器编码,基于SIP的中心信令控制服务器①.PDF
  5. 优秀!22岁读博士,26岁当教授,因为太优秀反而没人敢追?
  6. ningbooj--1655--木块拼接(贪心)
  7. 【Pytorch神经网络理论篇】 02 Pytorch快速上手(二)GPU与CPU张量切换+具有随机值的张量+张量的数学运算
  8. 【2019.08.21】2019杭电多校第十场
  9. 最新出炉程序猿使用说明书
  10. 几种距离公式的总结思考
  11. ModuleNotFoundError: No module named ‘pyemd‘ 解决
  12. 2021年《职业防治法》宣传周活动资料海报挂图及职业病知识小手册等
  13. 全国各地城市FM调频电台频率列表(上海北京广州深圳长沙武汉重庆)
  14. Linux中设置Java程序开机自动运行
  15. Golang可能会踩的58个坑之高级篇
  16. Validation进行参数校验
  17. 不知道吧?未加工的食物可以帮助你减肥
  18. yy安全中心官网首页登录html,YY安全中心
  19. 信息安全数学基础(仅供个人复习使用)
  20. Revit中土建模块【精准生梁】快速生成

热门文章

  1. c# 创建委托 消息订阅_C#面向对象之委托和事件
  2. python dataframe遍历_对Python中DataFrame按照行遍历的方法
  3. cmd输入pip报错_使用Pip管理Python的包
  4. 黑苹果uhd630黑屏_求助各位图吧大佬一个黑苹果问题(黑苹果吧发帖得四级),目前使...
  5. 笔记本电脑摄像头不能用_电脑没有摄像头怎么办
  6. 毕业典礼留学生代表发言:中国是我可亲可敬可爱的第二故乡,我已修炼出一颗中国心!...
  7. 三观碎一地:轮子天天见,车轮悖论却2000年无解?
  8. 深度学习弯道超车,领先行业不止一点点
  9. 对应oracle生成java对象,Java学习笔记(十三)——通过Netbeans开发环境生成oracle数据库中表的对应hibernate映射文件...
  10. oracle11g创建闪回分区多大,Oracle闪回区大小预估