转载自  面试官:给我说一下你理解的分布式架构

# 什么是分布式架构

分布式系统(distributed system) 是建立在网络之上的软件系统。

内聚性:是指每一个数据库分布节点高度自治,有本地的数据库管理系统。

透明性:是指每一个数据库分布节点对用户的应用来说都是透明的,看不出是本地还是远程。

在分布式数据系统中,用户感觉不数据是分布的,即用户不须知道关系是否分割,有无副本,数据存在于那个站点以及事物在哪个站点上执行。

简单来说,在一个分布式系统中,一组独立的计算机展现给用户的是一个统一的整体,就好像是一个系统似的。

分布式系统作为一个整体对用户提供服务,而整个系统的内部的协作对用户来说是透明的,用户就像是指使用一个Mysql一样,如:分布式Mysql中间件Mycat ,来处理大并发大数据量的构架。

# 分布式架构的应用

1、分布式文件系统

例如:出名的有 Hadoop 的 HDFS, 还有 google的 GFS , 淘宝的 TFS 等

2、分布式缓存系统

例如:memcache , hbase, mongdb 等

3、分布式数据库

例如:mysql, mariadb, postgreSql 等

4、分布式webService

5、分布式计算

举例

以分布式MySQL数据库中间件mycat 为例。   

MySQL在现在电商以及互联网公司的应用非常多,一个是因为他的免费开源,另外一个原因是因为分布式系统的水平可扩展性,随着移动互联网用户的暴增,互联网公司,像淘宝,天猫,唯品会等。

电商都采用分布式系统应对用户的高并发量以及大数据量的存储。而在Mycat的商业案例中,有对中国移动的账单结算项目中,应用实时处理高峰期每天2亿的数据量,在对物联网的项目中,实现处理高达26亿的数据量,并提供实时查询的接口。

通过对MyCat的学习,加深分布式系统架构的理解,以及分布式相关的技术,分布式一致性ZooKeeper服务, 高可用HAProxy/keepalived等相关应用。

  • 集群与分布式

  • 负载均衡

  • 分布式相关的高可用、容灾等名词解释

  • Mycat中间件学习

# 资源推荐

1、大型分布式网站架构设计与实践

2、大型网站技术架构:核心原理与案例分析

3、大型网站系统与Java中间件实践

4、分布式Java应用:基础与实践

# 分布式架构的演进

1、初始阶段架构

特征:应用程序,数据库,文件等所有资源都放在一台服务器上。

2、应用服务和数据服务以及文件服务分离

说明:好景不长,发现随着系统访问量的再度增加,webserver机器的压力在高峰期会上升到比较高,这个时候开始考虑增加一台webserver。

特征:应用程序、数据库、文件分别部署在独立的资源上。

3、使用缓存改善性能

说明:系统访问特点遵循二八定律,即80%的业务访问集中在20%的数据上。缓存分为本地缓存和远程分布式缓存,本地缓存访问速度更快但缓存数据量有限,同时存在与应用程序争用内存的情况。

特征:数据库中访问较集中的一小部分数据存储在缓存服务器中,减少数据库的访问次数,降低数据库的访问压力。

4、使用应用服务器集群

说明:在做完分库分表这些工作后,数据库上的压力已经降到比较低了,又开始过着每天看着访问量暴增的幸福生活了。突然有一天,发现系统的访问又开始有变慢的趋势了,这个时候首先查看数据库,压力一切正常,之后查看webserver,发现apache阻塞了很多的请求,而应用服务器对每个请求也是比较快的,看来是请求数太高导致需要排队等待,响应速度变慢。

特征:多台服务器通过负载均衡同时向外部提供服务,解决单台服务器处理能力和存储空间上限的问题。

描述:使用集群是系统解决高并发、海量数据问题的常用手段。通过向集群中追加资源,提升系统的并发处理能力,使得服务器的负载压力不再成为整个系统的瓶颈。

5、数据库读写分离

说明:享受了一段时间的系统访问量高速增长的幸福后,发现系统又开始变慢了,这次又是什么状况呢,经过查找,发现数据库写入、更新的这些操作的部分数据库连接的资源竞争非常激烈,导致了系统变慢

特征:多台服务器通过负载均衡同时向外部提供服务,解决单台服务器处理能力和存储空间上限的问题。

描述:使用集群是系统解决高并发、海量数据问题的常用手段。通过向集群中追加资源,使得服务器的负载压力不在成为整个系统的瓶颈。

6、反向代理和CDN加速

特征:采用CDN和反向代理加快系统的访问速度。

描述:为了应付复杂的网络环境和不同地区用户的访问,通过CDN和反向代理加快用户访问的速度,同时减轻后端服务器的负载压力。CDN与反向代理的基本原理都是缓存。

7、“分布式文件”系统 和 “分布式数据库”

说明:随着系统的不断运行,数据量开始大幅度增长,这个时候发现分库后查询仍然会有些慢,于是按照分库的思想开始做分表的工作。

特征:数据库采用分布式数据库,文件系统采用分布式文件系统。

描述:任何强大的单一服务器都满足不了大型系统持续增长的业务需求,数据库读写分离随着业务的发展最终也将无法满足需求,需要使用分布式数据库及分布式文件系统来支撑。分布式数据库是系统数据库拆分的最后方法,只有在单表数据规模非常庞大的时候才使用,更常用的数据库拆分手段是业务分库,将不同的业务数据库部署在不同的物理服务器上。

8、使用NoSQL和搜索引擎

特征:系统引入NoSQL数据库及搜索引擎。

描述:随着业务越来越复杂,对数据存储和检索的需求也越来越复杂,系统需要采用一些非关系型数据库如NoSQL和分数据库查询技术如搜索引擎。应用服务器通过统一数据访问模块访问各种数据,减轻应用程序管理诸多数据源的麻烦。

9、业务拆分

特征:系统上按照业务进行拆分改造,应用服务器按照业务区分进行分别部署。

描述:为了应对日益复杂的业务场景,通常使用分而治之的手段将整个系统业务分成不同的产品线,应用之间通过超链接建立关系,也可以通过消息队列进行数据分发,当然更多的还是通过访问同一个数据存储系统来构成一个关联的完整系统。

纵向拆分:将一个大应用拆分为多个小应用,如果新业务较为独立,那么就直接将其设计部署为一个独立的Web应用系统 纵向拆分相对较为简单,通过梳理业务,将较少相关的业务剥离即可。

横向拆分:将复用的业务拆分出来,独立部署为分布式服务,新增业务只需要调用这些分布式服务 横向拆分需要识别可复用的业务,设计服务接口,规范服务依赖关系。

10、分布式服务

特征:公共的应用模块被提取出来,部署在分布式服务器上供应用服务器调用。

描述:随着业务越拆越小,应用系统整体复杂程度呈指数级上升,由于所有应用要和所有数据库系统连接,最终导致数据库连接资源不足,拒绝服务。

# 分布式服务应用会面临哪些问题?

  1. 当服务越来越多时,服务URL配置管理变得非常困难,F5硬件负载均衡器的单点压力也越来越大。

  2. 当进一步发展,服务间依赖关系变得错踪复杂,甚至分不清哪个应用要在哪个应用之前启动,架构师都不能完整的描述应用的架构关系。

  3. 接着,服务的调用量越来越大,服务的容量问题就暴露出来,这个服务需要多少机器支撑?什么时候该加机器?

  4. 服务多了,沟通成本也开始上升,调某个服务失败该找谁?服务的参数都有什么约定?

  5. 一个服务有多个业务消费者,如何确保服务质量?

  6. 随着服务的不停升级,总有些意想不到的事发生,比如cache写错了导致内存溢出,故障不可避免,每次核心服务一挂,影响一大片,人心慌慌,如何控制故障的影响面?服务是否可以功能降级?或者资源劣化?

面试官:给我说一下你理解的分布式架构相关推荐

  1. 面试官:说说对observable的理解

    一.Observable 是什么 Observable 翻译过来我们可以理解成可观察的 我们先来看一下其在Vue中的定义 Vue.observable,让一个对象变成响应式数据.Vue 内部会用它来处 ...

  2. 原来腾讯面试题也不难,面试官:给我说一下你理解的分布式架构?

    什么是分布式架构 分布式系统(distributed system) 是建立在网络之上的软件系统. 内聚性:是指每一个数据库分布节点高度自治,有本地的数据库管理系统. 透明性:是指每一个数据库分布节点 ...

  3. 重复订单号校验_吊打面试官系列重复消费、顺序消费、分布式事务

    你知道的越多,你不知道的越多 前言 消息队列在互联网技术存储方面使用如此广泛,几乎所有的后端技术面试官都要在消息队列的使用和原理方面对小伙伴们进行360°的刁难. 作为一个在互联网公司面一次拿一次Of ...

  4. 膜拜大佬!被面试官问的Android问题难倒了,附架构师必备技术详解

    前言 下面的题目都是楼主在Android交流群大家在面试字节跳动时遇到的,如果大家有好的题目或者好的见解欢迎分享,楼主将长期维护此帖. 参考解析:郭霖.鸿洋.玉刚.极客时间.腾讯课堂- 内容特点:条理 ...

  5. 程序员面试怎么回答面试官:你对Spring的理解?

    spring呢,是pivotal公司维护的一系列开源工具的总称,最为人所知的是spring mvc,事实上,他们都是基于spring framework,并且再其上继续增强,为某一方面服务的java组 ...

  6. 面试官:说说你对操作系统的理解?核心概念有哪些?

    一.是什么 操作系统(Operating System,缩写:OS)是一组主管并控制计算机操作.运用和运行硬件.软件资源和提供公共服务来组织用户交互的相互关联的系统软件程序,同时也是计算机系统的内核与 ...

  7. 面试官:高并发下,如何保证分布式唯一全局 ID 生成?

    欢迎关注方志朋的博客,回复"666"获面试宝典 前言 系统唯一ID是我们在设计一个系统的时候常常会遇见的问题,也常常为这个问题而纠结. 这篇文章就是给各位看官提供一个生成分布式唯一 ...

  8. redis setnx 过期时间_阿里面试官:你确定你用过 Redis 分布式锁吗?

    你有听说过 Redlock 吗? 别整些花里胡哨的,Redlock 全称 Redis Distributed Lock,即用 Redis 实现的分布式锁. Redis 热身知识 Redis 命令参考: ...

  9. 面试官问我:你们的数据库是怎么架构的?

    戳蓝字"CSDN云计算"关注我们哦! 作者:尜尜人物 来源:https://www.cnblogs.com/littlecharacter/p/9084291.html 一.数据库 ...

最新文章

  1. 分布式监控系统Zabbix3.2添加自动发现磁盘IO并注册监控
  2. linux usb xhci ehci,ehci和xhci有什么区别
  3. Codeforces Round #102 (Div. 1) A. Help Farmer 暴力分解
  4. 如何使用JMeter自身代理录制APP测试脚本
  5. Web服务器处理Servlet处理请求过程
  6. .NET(C#)代码性能优化
  7. Win7 Windows照片查看器无法显示此图片,因为计算机上的可用内存可能不足
  8. SDN实验(三)——集线器hub的实现
  9. 汉高将在上海成立新的粘合剂技术创新中心;宁德时代与戴姆勒卡车扩大全球合作伙伴关系 | 美通企业日报...
  10. 明源云客微信抢房技巧_明源云客车位线上开盘体验 - 微信抢房_软件抢房_网上选房_手机抢房_代抢房 - 爱抢房...
  11. 第五章第二十八题(显示每月第一天是星期几)(Display the first days of each month)
  12. php判断是否是全英文,php判断字符串是否全英文,纯中文,中英文组合的方法
  13. iOS app签名机制
  14. Linux发行版本及常用国产系统+系统优化
  15. lumia535 刷Android,附教程:看看你的Lumia手机能不能刷安卓!
  16. 在WinServer上安装小红伞杀毒软件的经验总结
  17. android 获取摄像头像素
  18. 计算机网络与应用初稿,《计算机与网络应用》初稿
  19. 淘宝开放平台的盈利模式
  20. 关于局域网ARP攻击,MAC地址欺骗的解决方法

热门文章

  1. 个人博客前端模板_腾讯前端开发工程师,教你极速搭建一个个人博客网站
  2. PTA 7-3 地铁一日游 (30 分)
  3. 值得关注的HTML基础
  4. [MyBatisPlus]乐观锁和悲观锁
  5. [Java基础]反射获取成员变量并使用
  6. 十一届蓝桥杯国赛 美丽的2-枚举
  7. 一个毕设的建成——记录下我毕设途中的《SOP》
  8. GCD and LCM HDU - 4497(素数打表+唯一分解定理)求多少种情况
  9. SQL(七) - 事务、索引、视图
  10. Qt 调试Caffe