从集中式到分布式

前言

随着计算机系统规模变得越来越大,将所有业务单元集中部署在一个或者若干个大型机 上的体系结构物,已经越来越不能满足当今计算机系统,尤其是大型互联网系统的快速发展,各种灵活多变的系统架构模型层出不穷。同时,随着微型计算机的出 现,越来越多廉价的PC机成为了各大IT企业架构的首选,分布式的处理方式越来越受到业界的青睐----计算机系统正在经历一场前所未有的从集中式到分布 式架构的变革。

从集中式到分布式

自从20世纪60年代大型主机被发明出来以后,凭借其超强的计算和I/O处理能力 以及在稳定性和安全性方面的卓越表现,在很长一段时间内,大型主机引领了计算机行业以及商业计算领域的发展。在大型主机的研发上最知名的当属IBM,其主 导研发的革命性产品System/360系列大型主机,是计算机发展史上的一个里程碑,与波音707和福特T型车齐名,被誉为20世纪最重要的三大商业成 就,IT界进入了大型主机时代。

伴随着大型主机时代的到来,集中式的计算机系统架构也成为了主流。在那个时候,由 于大型主机卓越的性能和良好的稳定性,其在单机处理能力方面的优势非常明显,使得IT系统快速进入了集中式处理阶段,其对应的计算机系统称为集中式系统。 但从20世纪80年代以来,计算机系统向网络化和微型化的发展日趋明显,传统的集中式处理模型越来越不能适应人们的需求,具体表现在:

1、大型主机的人才培养成本非常高,通常一台大型主机汇集了大量精密的计算机组件,操作非常复杂,这对一个运维人员掌握其技术细节提出了非常高的要求

2、大型主机也是非常昂贵的,通常一台配置较好的IBM大型主机,其售价达到上百万美元甚至更高,因此也只有像政府、金融和电信等企业才有能力采购大型主机

3、集中式有非常明显的单点问题,大型主机虽然在性能和稳定性方面表现卓越,但并 不代表其永远不会出故障。一旦一台大型主机出现了故障,那么整个系统将处于不可用的状态,后果相当严重。最后,随着业务的不断发展,用户访问量迅速提高, 计算机系统的规模也在不断扩大,在单一大型主机上进行扩容往往比较困难

4、随着PC机性能的不断提升和网络技术的快速普及,大型主机的市场份额变得越来越小,很多企业开始放弃原来的大型主机,而改用小型机和普通PC服务器来搭建分布式计算机

对业内新闻比较关注的,一定知道阿里巴巴在2009年发起了一项"去IOE"运动。 因为阿里巴巴从2008年开始各项业务都进入了井喷式的发展阶段,这对于后台IT系统的计算与存储能力提出了非常高的要求,一味地针对小型机和高端存储进 行不断扩容,无疑会产生巨大的成本。同时,集中式的系统架构体系也存在着诸多单点问题,完全无法满足互联网应用爆炸式的发展需求。因此,为了解决业务快速 发展给IT系统带来的巨大挑战,从2009年开始,阿里集团启动了"去IOE"计划,其电商系统开始正式迈入了分布式系统时代。

集中式

所谓集中式系统就是指由一台或多台主计算机组成中心节点,数据集中存储于这个中心 节点中,并且整个系统的所有业务单元都集中部署在这个中心节点上,系统所有的功能均由其集中处理。也就是说,集中式系统中,每个终端或客户端及其仅仅负责 数据的录入和输出,而数据的存储与控制处理完全交由主机来完成。

集中式系统最大的特点就是部署结构简单,由于集中式系统往往基于底层性能卓越的大型主机,因此无需考虑如何对服务进行多个节点的部署,也就不用考虑多个节点之间的分布式协作问题。

分布式

分布式系统如何定义?这里引用一下Distributed Systems Concepts and Design(Third Edition)中的一句话:"A distributed system is one in which components located at networked computers communicate and coordinate their actions only by passing messages"。从这句话里面我们可以看到几个重点:

1、组件分布在网络计算机上

2、组件之间仅仅通过消息传递来通信并协调行动

严格讲,同一个分布式系统中的计算机在空间部署上是可以随意分布的,这些计算机可能被放在不同的机柜上,也可能在不同的机房中,甚至分布在不同的城市。无论如何,一个标准的分布式系统在没有任何特定业务逻辑约束的情况下,都会有以下几个特征:

1、分布性

分布式系统中的多台计算机都会在空间上随意分布,同时,及其的分布情况也会随时变动

2、对等性

分布式系统中的计算机没有主/从之分,既没有控制整个系统的主机,也没有被控制的 从机,组成分布式系统的所有节点都是对等的。副本(Replica)是分布式系统最常见的概念之一,指的是分布式系统对数据和服务提供的一种冗余方式。在 常见的分布式系统中,为了对外提高可用的服务,我们往往会对数据和服务进行副本处理。数据副本是指在不同的节点上持久化同一份数据,当某一个节点上存储的 数据丢失时,可以从副本上读取到该数据,这是解决分布式系统数据丢失问题最为有效的手段。另一类副本是服务副本,指多个节点提供同样的服务,每个节点都有 能力接收来自外部的请求并进行相应的处理

3、并发性

在一个计算机网络中,程序运行过程中的并发性操作是非常常见的行为,例如同一个分布式系统的多个节点,可能会并发地操作一些共享的资源,诸如数据库或分布式存储等,如何准确并高效地协调分布式并发操作也成为了分布式系统架构与设计中最大的挑战之一

4、缺乏全局时钟

一个典型的分布式系统是由一系列空间上随意分布的多个进程组成的,具有明显的分布性,这些进程之间通过交换消息来进行相互通信。因此,在分布式系统中,很难定义两个事件究竟谁先谁后,原因就是因为分布式系统缺乏一个全局的始终控制序列

5、故障总是会发生

组成分布式系统的所有计算机,都有可能发生任何形式的故障。一个被大量工程实践过 的黄金定理是:任何在设计阶段考虑到的异常情况,一定会在系统实际运行中发生,并且,在系统实际运行中还会遇到很多在设计时未考虑到的异常故障。所以,除 非需求指标允许,在系统设计时不能放过任何异常情况

6、处理单点故障

在整个分布式系统中,如果某个角色或者功能只有某台单机在支撑,那么这个节点称为单点,其发生的故障称为单点故障,也就是通常说的SPoF(Single Point of Failure),避免单点而对关键就是把这个功能从单机实现变为集群实现,当然,这种变化一般会比较困难,否则就不会有单点问题了。如果不能把单点变为集群实现,那么一般还有两种选择:

(1)给这个单点做好备份,能够在出现问题时进行恢复,并且尽量做到自动恢复

(2)降低单点故障的影响范围

分布式系统的意义

从单机单用户到单机多用户,再到现在的网络时代,应用系统发生了很多的变化。而分布式系统依然是目前很热门的讨论话题,那么,分布式系统给我们带来了什么,或者说是为什么要有分布式系统呢?从三方面考虑:

1、升级单机处理能力的性价比越来越低

摩尔定律:当价格 不变时,每隔18个月,集成电路上可容纳的晶体管数目会增加一倍,性能也将提升一倍。这个定律告诉我们,随着时间的推移,单位成本的支出所能购买的计算机 能力在提升。不过,如果我们把时间固定下来 ,也就是固定在某个具体时间点来购买单颗不同型号的处理器,那么所购买的处理器性能越高,所要付出的成本就越高,性价比就越低。那么,也就是说在一个确定 的时间点,通过更换硬件做垂直扩展的方式来提升性能会越来越不划算

2、单机处理能力存在瓶颈

某个固定时间点,单颗处理器有自己的性能瓶颈,也就说即使愿意花更多的钱去买计算能力也买不到了

3、出于稳定性和可用性的考虑

如果采用单击系统,那么在这台机器正常的时候一切OK,一旦出问题,那么系统就完全不能用了。当然,可以考虑做容灾备份等方案,而这些方案就会让系统演变为分布式系统了

分布式存储与集中式存储相关推荐

  1. 集中式存储与分布式存储

    文章目录 集中式存储 概念 三种集中式存储结构 DAS NAS SAN 分布式存储 差别: 分布式存储优点 集中式存储 概念 SCSI接口 小型计算机系统接口:就是计算机主机内部设备之间(硬盘.软驱. ...

  2. 集中式存储和分布式存储

    集中式存储和分布式存储 集中式存储: RAID技术:(冗余磁盘阵列) 高效(多块磁盘并行读写) 安全(奇偶校验和热备技术) 常用的RAID类型 RAID0(条带化):多块硬盘逻辑成一块硬盘用(不具备冗 ...

  3. 分布式,集中式,云原生存储技术

    分布式,集中式,云原生存储技术 分布式存储软件是真正的统一存储,实现同一套存储系统为上层应用提供块.文件和对象三种数据服务,满足业务对结构化和非结构化数据的存放需求,内置数据保护功能,例如:备份.容灾 ...

  4. 聊一聊单机、集中式、分布式和云原生存储

    点击上方"朱小厮的博客",选择"设为星标" 后台回复"书",获取 后台回复"k8s",可领取k8s资料 背景 本文主要对 ...

  5. oracle适合分布式架构吗,争议|集中式 vs 分布式,医院集成平台存储应选择谁?...

    来源:twt社区 医院集成平台存储选型问题?是选择集中式还是分布式? 在新的集成平台中,我们的系统提出支持热备高可用性部署,主备机之间配置.消息库可实时同步,当主机发生故障时,备机可在不需人工干预的情 ...

  6. 某大型保险集团在线财险业务系统数据库存储架构由集中式向分布式转型实践

     [摘要]随着某机构业务自传统B2B类型向互联网的转变,访问量的激增.用户量持续爆炸式增长.数据量爆炸式增长,业务场景具备高吞吐量.高并发量等等新需求,这些都要求后台数据库具备支持高TPS.高QPS( ...

  7. 探讨下如何更好的使用缓存 —— 集中式缓存Redis的BitMap存储、管道与事务、以及与本地缓存一起构建多级缓存

    大家好,又见面了. 通过前面的文章,我们一起剖析了Guava Cache.Caffeine.Ehcache等本地缓存框架的原理与使用场景,也一同领略了以Redis为代表的集中式缓存在分布式高并发场景下 ...

  8. 集中式还是分布式?账务类数据库架构的选型

    近年来,分布式数据库已经成为了行业中默认的主流技术方向,仿佛只要一款数据库不是分布式架构,即丧失了其技术先进性,无法承载未来业务的发展.这种观点对于"大数据"时代的海量数据需求完全 ...

  9. 分布式体系结构:非集中式结构

    分布式体系结构:非集中式结构 前言 什么是非集中式结构? Akka 集群 Redis 集群 Cassandra 集群 对比分析 知识扩展:如何优化 Gossip 协议中的重复消息问题? 总结 前言 虽 ...

最新文章

  1. 业界首发丨网易云信虚拟人解决方案,首创客户端+云端双渲染技术
  2. db2 最近三个月_昙花一现,PA、PC月跌1800,通用料一蹶不振,救不起的塑市!
  3. 不相交集ADT(联机算法 + 脱机算法)
  4. C++设计模式之策略模式(Strategy)
  5. OpenShift 4 - Fedora CoreOS (1) - 最简安装
  6. 安装allennlp库
  7. 单片机原理及其应用试题(含答案)
  8. 中国联通:网络重构转型的战略规划及痛点
  9. 什么是广域网(WAN)?
  10. 设计模式之装饰器模式
  11. mini计算机结构,简单拆机看内部构造_苹果 Mac mini MGEN2CH/A_台式电脑评测-中关村在线...
  12. recon-ng V5.0 更新版本 被动信息收集
  13. html5流水账,流水记账.html
  14. 2_嵌入式软件开发简介
  15. 利用临时二维码实现在电脑浏览器上的微信扫码登陆功能 - EasyWeChat版
  16. sqlite多进程并发读写模式下,返回SQLITE_BUSY错误的处理方法
  17. 用计算机弹奏若当来世,若当来世简谱(歌词)-马里奥、冥月演唱-动画片《狐妖小红娘 第三季》片头曲...
  18. Go并发原语/并发组件/go并发核心语法 之channel
  19. 19 Flowable任务之调用子流程(CallActivity)
  20. 读“Hyperspectral Image Classification With Squeeze Multibias Network”

热门文章

  1. Unity最简单的消息中心
  2. matlab滤波实验,卡尔曼滤波实验及matlab实现
  3. 单片机之中断优先级设置
  4. JS input[type=file]读取本地文件(读取json文件)
  5. python如何爬有道翻译_如何利用Python网络爬虫来获取有道翻译翻译接口--手机版的哦!...
  6. Linux脚本的制作命令
  7. C语言源代码系列-管理系统之单项选择题标准化考试系统设计
  8. 软件开发生命周期有几个阶段?
  9. 微服务扩展之AKF拆分原则
  10. SQL语句的一个面试题目