变而不变:我看分布式系统发展和阿里实践
原文链接:http://click.aliyun.com/m/13967/
大数据计算服务(MaxCompute)是一种快速、完全托管的PB/EB级数据仓库解决方案。具备万台服务器扩展能力和跨地域容灾能力,是阿里巴巴内部核心大数据平台,支撑每日百万级作业规模。
MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。
相对而言,Reshuffle数据需要落盘,因为Resuffle把多个机器联系起来,出错概率大大增加。但是落盘大大降低了系统的性能,如果只是简单用network的方式来Shuffle数据,则不能容错。
而MaxCompute采用Network-Disk的可自适应性的channel来进行Data-Shuffle。
在MaxComputeAPI取舍中,二八原则体现得十分明显。流计算用户80%对latency更为看重,批处理用户80%对throughput更为看重,我们BI系统希望服务好高频的20%的数据,使得80%的访问都达到毫秒级。
系统设计中常用方法有:空间换时间、时间换空间、API层次设计、系统中层次法。MaxCompute数仓采用层次化设计方法。一致性变强,容量变小,吞吐性能变小,成本变高,问题规模变小。
转载于:https://blog.51cto.com/11778640/1906659
变而不变:我看分布式系统发展和阿里实践相关推荐
- 从myspace数据库看分布式系统数据结构变迁
从myspace数据库看分布式系统数据结构变迁 http://smb.pconline.com.cn/database/0808/1403100.html [08-29 14:33:40]出处:pco ...
- 专访百度蒋凡:从RecSys2013大会看推荐系统发展新趋势
专访百度蒋凡:从RecSys2013大会看推荐系统发展新趋势 发表于2013-10-28 11:38| 2169次阅读| 来源CSDN| 6 条评论| 作者薛梁 RecSys2013数据挖掘大数据推荐 ...
- 从电子游戏历史看IC发展的助推剂
我一直认为"玩"是人类发展进度的阶梯之一,从历史进程看,很多重大的发明都是从"玩"的过程中发现的,所以电子游戏的历史和IC的发展有很多重大的历史渊源,而且电子游 ...
- 变速恒频风电机组的优缺点_两种主流变速恒频风电机组技术发展综述
两种主流变速恒频风电机组技术发展综述 [摘 要]通过对目前大型风电机组技术研究,分别对双馈异步.永磁同步 直驱两种主流变速恒频机组从典型接线方式, 各种控制技术研究热点等多方面进 行分析比较, 认为新 ...
- 《架构设计2.0大型分布式系统架构方法论与实践》三高笔记
目录 前言 高并发 高并发读 动静分离与CDN加速 缓存 并发读与Pipeline 重写轻读 读写分离 批量 高并发写 数据分片 任务分片 异步化 批量 高可靠 七板斧 高可用 高可用架构几个核心问题 ...
- 【渝粤题库】国家开放大学2021春1703农村发展理论与实践题目
试卷代号:1703 2021年春季学期期末统一考试 农村发展理论与实践 试题 2021年7月 一.单选题(20题,每题3分,共60分) 1.在农村发展的"参与式方法"中," ...
- android 第三方社区,从友盟微社区看Android第三方SDK架构实践
原标题:从友盟微社区看Android第三方SDK架构实践 开发Android第三方SDK说难不难,但说简单也不简单,要开发一个给很多人使用的第三方SDK,如何在保证稳定性的同时,增强SDK的灵活性,让 ...
- 一看就懂关于阿里云服务器地域和可用区的选择方法
阿里云服务器地域和可用区是什么关系?很多用户不清楚什么是地域?什么是云服务器可用区,地域是指云服务器数据中心所在的物理位置,可用区是指同地域下电力和网路相互独立的区域,阿里云服务器网分享云服务器地域和 ...
- 帆软行业总监陈鹏:从500强企业看企业数据应用最佳实践
近日,畅享网携手appcan成功举办企业"移动化"案例分享沙龙.本次沙龙由新城控股集团星翼空间总经理從申主持,精准聚焦"移动化"成功转型案例.会上,各位IT专业 ...
最新文章
- 给大家推荐8个SpringBoot精选项目
- 009_Gson版本支持
- 自定义View时,用到Paint Canvas的一些温故,讲讲平时一些效果是怎么画的(基础篇 一)...
- Mac 读写NTFS硬盘
- SQL 语法参考手册
- python的作用域分别有几种_python中作用域与函数嵌套
- JAVA简单的SWING及AWT
- centos 减少tty数量的方法
- 非法关机的时候,postgresql启动故障的解决
- Linux文件目录命令,有这些就够了?
- 在iMac上如何轻松去掉程序坞中最近打开过的应用--小技巧
- python 英文语义分析_python语意分析
- 库存转换是什么意思_安全库存的设置:库存计划的看家本领
- 金蝶KIS专业版V14.1下载链接,金蝶KIS专业版V14.1新增功能介绍 安装包下载地址
- 跨考西电计算机科学与技术专业介绍,2021年西安电子科技大学计算机科学与技术(081200)人工智能交叉研究方向_考研专业目录_考试科目_考试范围 - 学途吧...
- 学堂在线-清华大学-操作系统实验Lab1【练习3-4】
- Relation Extraction 关系抽取综述
- 各网络厂商MIB库获取
- 美国计算机专业博士申请条件,美国留学申请计算机专业硕士及博士条件
- 如何选取合适的运算放大器?
热门文章
- 奇数页分节符什么意思_删除分节符问题
- clob存base64文件存不进去_Kafka 和 RocketMQ 底层存储之那些你不知道的事
- mysql查询员工表中所有员工入职20个月之后的日期_Mysql基础教程
- Oracle10g补丁怎么安装,在CentOS6.4上安装oracle10g需要的补丁
- java 图像采集_JAVA B/S通过摄像头采集图片信息解决方案。
- 电话双音频拨码信号采集
- 智能车竞赛技术报告 | 节能信标组-哈尔滨工业大学紫丁香五队
- 电子漫画 - 轻轻松松
- 基于2SK4037的射频功率放大电路实验
- POI Excel 如何插入新的行?