原文链接:http://click.aliyun.com/m/13967/

大数据计算服务(MaxCompute)是一种快速、完全托管的PB/EB级数据仓库解决方案。具备万台服务器扩展能力和跨地域容灾能力,是阿里巴巴内部核心大数据平台,支撑每日百万级作业规模。

MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。

相对而言,Reshuffle数据需要落盘,因为Resuffle把多个机器联系起来,出错概率大大增加。但是落盘大大降低了系统的性能,如果只是简单用network的方式来Shuffle数据,则不能容错。

而MaxCompute采用Network-Disk的可自适应性的channel来进行Data-Shuffle。

在MaxComputeAPI取舍中,二八原则体现得十分明显。流计算用户80%对latency更为看重,批处理用户80%对throughput更为看重,我们BI系统希望服务好高频的20%的数据,使得80%的访问都达到毫秒级。

系统设计中常用方法有:空间换时间、时间换空间、API层次设计、系统中层次法。MaxCompute数仓采用层次化设计方法。一致性变强,容量变小,吞吐性能变小,成本变高,问题规模变小。

转载于:https://blog.51cto.com/11778640/1906659

变而不变:我看分布式系统发展和阿里实践相关推荐

  1. 从myspace数据库看分布式系统数据结构变迁

    从myspace数据库看分布式系统数据结构变迁 http://smb.pconline.com.cn/database/0808/1403100.html [08-29 14:33:40]出处:pco ...

  2. 专访百度蒋凡:从RecSys2013大会看推荐系统发展新趋势

    专访百度蒋凡:从RecSys2013大会看推荐系统发展新趋势 发表于2013-10-28 11:38| 2169次阅读| 来源CSDN| 6 条评论| 作者薛梁 RecSys2013数据挖掘大数据推荐 ...

  3. 从电子游戏历史看IC发展的助推剂

    我一直认为"玩"是人类发展进度的阶梯之一,从历史进程看,很多重大的发明都是从"玩"的过程中发现的,所以电子游戏的历史和IC的发展有很多重大的历史渊源,而且电子游 ...

  4. 变速恒频风电机组的优缺点_两种主流变速恒频风电机组技术发展综述

    两种主流变速恒频风电机组技术发展综述 [摘 要]通过对目前大型风电机组技术研究,分别对双馈异步.永磁同步 直驱两种主流变速恒频机组从典型接线方式, 各种控制技术研究热点等多方面进 行分析比较, 认为新 ...

  5. 《架构设计2.0大型分布式系统架构方法论与实践》三高笔记

    目录 前言 高并发 高并发读 动静分离与CDN加速 缓存 并发读与Pipeline 重写轻读 读写分离 批量 高并发写 数据分片 任务分片 异步化 批量 高可靠 七板斧 高可用 高可用架构几个核心问题 ...

  6. 【渝粤题库】国家开放大学2021春1703农村发展理论与实践题目

    试卷代号:1703 2021年春季学期期末统一考试 农村发展理论与实践 试题 2021年7月 一.单选题(20题,每题3分,共60分) 1.在农村发展的"参与式方法"中," ...

  7. android 第三方社区,从友盟微社区看Android第三方SDK架构实践

    原标题:从友盟微社区看Android第三方SDK架构实践 开发Android第三方SDK说难不难,但说简单也不简单,要开发一个给很多人使用的第三方SDK,如何在保证稳定性的同时,增强SDK的灵活性,让 ...

  8. 一看就懂关于阿里云服务器地域和可用区的选择方法

    阿里云服务器地域和可用区是什么关系?很多用户不清楚什么是地域?什么是云服务器可用区,地域是指云服务器数据中心所在的物理位置,可用区是指同地域下电力和网路相互独立的区域,阿里云服务器网分享云服务器地域和 ...

  9. 帆软行业总监陈鹏:从500强企业看企业数据应用最佳实践

    近日,畅享网携手appcan成功举办企业"移动化"案例分享沙龙.本次沙龙由新城控股集团星翼空间总经理從申主持,精准聚焦"移动化"成功转型案例.会上,各位IT专业 ...

最新文章

  1. 给大家推荐8个SpringBoot精选项目
  2. 009_Gson版本支持
  3. 自定义View时,用到Paint Canvas的一些温故,讲讲平时一些效果是怎么画的(基础篇 一)...
  4. Mac 读写NTFS硬盘
  5. SQL 语法参考手册
  6. python的作用域分别有几种_python中作用域与函数嵌套
  7. JAVA简单的SWING及AWT
  8. centos 减少tty数量的方法
  9. 非法关机的时候,postgresql启动故障的解决
  10. Linux文件目录命令,有这些就够了?
  11. 在iMac上如何轻松去掉程序坞中最近打开过的应用--小技巧
  12. python 英文语义分析_python语意分析
  13. 库存转换是什么意思_安全库存的设置:库存计划的看家本领
  14. 金蝶KIS专业版V14.1下载链接,金蝶KIS专业版V14.1新增功能介绍 安装包下载地址
  15. 跨考西电计算机科学与技术专业介绍,2021年西安电子科技大学计算机科学与技术(081200)人工智能交叉研究方向_考研专业目录_考试科目_考试范围 - 学途吧...
  16. 学堂在线-清华大学-操作系统实验Lab1【练习3-4】
  17. Relation Extraction 关系抽取综述
  18. 各网络厂商MIB库获取
  19. 美国计算机专业博士申请条件,美国留学申请计算机专业硕士及博士条件
  20. 如何选取合适的运算放大器?

热门文章

  1. 奇数页分节符什么意思_删除分节符问题
  2. clob存base64文件存不进去_Kafka 和 RocketMQ 底层存储之那些你不知道的事
  3. mysql查询员工表中所有员工入职20个月之后的日期_Mysql基础教程
  4. Oracle10g补丁怎么安装,在CentOS6.4上安装oracle10g需要的补丁
  5. java 图像采集_JAVA B/S通过摄像头采集图片信息解决方案。
  6. 电话双音频拨码信号采集
  7. 智能车竞赛技术报告 | 节能信标组-哈尔滨工业大学紫丁香五队
  8. 电子漫画 - 轻轻松松
  9. 基于2SK4037的射频功率放大电路实验
  10. POI Excel 如何插入新的行?