高可用建设的着手点

说到系统的高可用建设,它其实是一个系统工程,需要考虑到系统建设的各个阶段,也就是说它其实贯穿了系统建设的整个生命周期,如下图所示:

具体来说,系统的高可用建设涉及架构阶段、编码阶段、测试阶段、发布阶段、运行阶段,以及故障发生时。

  1. 架构阶段:架构阶段主要考虑系统的可扩展性和容错性,要避免系统出现单点问题。例如多机房单元化部署,即使某个城市的某个机房出现整体故障,仍然不会影响整体网站的运转。
  2. 编码阶段:编码最重要的是保证代码的健壮性,例如涉及远程调用问题时,要设置合理的超时退出机制,防止被其他系统拖垮,也要对调用的返回结果集有预期,防止返回的结果超出程序处理范围,最常见的做法就是对错误异常进行捕获,对无法预料的错误要有默认处理结果。
  3. 测试阶段:测试主要是保证测试用例的覆盖度,保证最坏情况发生时,我们也有相应的处理流程。
  4. 发布阶段:发布时也有一些地方需要注意,因为发布时最容易出现错误,因此要有紧急的回滚机制。
  5. 运行阶段:运行时是系统的常态,系统大部分时间都会处于运行态,运行态最重要的是对系统的监控要准确及时,发现问题能够准确报警并且报警数据要准确详细,以便于排查问题。
  6. 故障发生:故障发生时首先最重要的就是及时止损,例如由于程序问题导致商品价格错误,那就要及时下架商品或者关闭购买链接,防止造成重大资产损失。然后就是要能够及时恢复服务,并定位原因解决问题。

保障系统的稳定运行的方面

降级

所谓“降级”,就是当系统的容量达到一定程度时,限制或者关闭系统的某些非核心功能,从而把有限的资源保留给更核心的业务。它是一个有目的、有计划的执行过程,所以对降级我们一般需要有一套预案来配合执行。如果我们把它系统化,就可以通过预案系统和开关系统来实现降级。降级方案可以这样设计:当秒杀流量达到 5w/s 时,把成交记录的获取从展示 20 条降级到只展示 5 条。“从 20 改到 5”这个操作由一个开关来实现,也就是设置一个能够从开关系统动态获取的系统参数。

执行降级无疑是在系统性能和用户体验之间选择了前者,降级后肯定会影响一部分用户的体验,例如在双 11 零点时,如果优惠券系统扛不住,可能会临时降级商品详情的优惠信息展示,把有限的系统资源用在保障交易系统正确展示优惠信息上,即保障用户真正下单时的价格是正确的。所以降级的核心目标是牺牲次要的功能和用户体验来保证核心业务流程的稳定,是一个不得已而为之的举措。

限流

限流就是更极端的一种保护措施了。限流就是当系统容量达到瓶颈时,我们需要通过限制一部分流量来保护系统,并做到既可以人工执行开关,也支持自动化保护的措施。总体来说,限流既可以是在客户端限流,也可以是在服务端限流。此外,限流的实现方式既要支持 URL 以及方法级别的限流,也要支持基于 QPS 和线程的限流。首先,我以内部的系统调用为例,来分别说下客户端限流和服务端限流的优缺点:

  • 客户端限流,好处可以限制请求的发出,通过减少发出无用请求从而减少对系统的消耗。缺点就是当客户端比较分散时,没法设置合理的限流阈值:如果阈值设的太小,会导致服务端没有达到瓶颈时客户端已经被限制;而如果设的太大,则起不到限制的作用。
  • 服务端限流,好处是可以根据服务端的性能设置合理的阈值,而缺点就是被限制的请求都是无效的请求,处理这些无效的请求本身也会消耗服务器资源。

在限流的实现手段上来讲,基于 QPS 和线程数的限流应用最多,最大 QPS 很容易通过压测提前获取,例如我们的系统最高支持 1w QPS 时,可以设置 8000 来进行限流保护。线程数限流在客户端比较有效,例如在远程调用时我们设置连接池的线程数,超出这个并发线程请求,就将线程进行排队或者直接超时丢弃。限流无疑会影响用户的正常请求,所以必然会导致一部分用户请求失败,因此在系统处理这种异常时一定要设置超时时间,防止因被限流的请求不能 fast fail(快速失败)而拖垮系统。

拒绝服务

如果限流还不能解决问题,最后一招就是直接拒绝服务了。当系统负载达到一定阈值时,例如 CPU 使用率达到 90% 或者系统 load 值达到 2*CPU 核数时,系统直接拒绝所有请求,这种方式是最暴力但也最有效的系统保护方式。例如秒杀系统,可以在如下几个环节设计过载保护:

  • 在最前端的 Nginx 上设置过载保护,当机器负载达到某个值时直接拒绝 HTTP 请求并返回 503 错误码。
  • 在 Java 层同样也可以设计过载保护。

拒绝服务可以说是一种不得已的兜底方案,用以防止最坏情况发生,防止因把服务器压跨而长时间彻底无法提供服务。像这种系统过载保护虽然在过载时无法提供服务,但是系统仍然可以运作,当负载下降时又很容易恢复,所以每个系统和每个环节都应该设置这个兜底方案,对系统做最坏情况下的保护。

8. 秒杀系统--设计兜底方案相关推荐

  1. 谈谈秒杀系统的落地方案

    昨天的文章给秒杀系列开了一个头,今天会集中讲一下实现一个秒杀系统的思路和方案,不代表这就是最好的方案或者最佳实践,而是希望通过这篇文章,能起到抛砖引玉的作用,希望有更佳的思路提供出来. 秒杀系统要解决 ...

  2. “秒杀系统“设计原理

    转载自:https://www.toutiao.com/i6844354907802173964/ 秒杀业务分析 正常电子商务流程: 查询商品 创建订单 扣减库存 更新订单 付款 卖家发货 秒杀业务的 ...

  3. 《如何设计一个秒杀系统》——专栏笔记

    秒杀系统架构设计的关键点 "秒杀系统"通常是与所谓的"商品系统"相互独立的.隔离的.秒杀其实主要解决两个问题,一个是并发读,一个是并发写,具体实现方式如下: 并 ...

  4. 思维升级-如何设计一个秒杀系统?

    技术面试中,高级开发职称以上必问,如果你没亲身设计过,那你需要了解一下设计中的细节. 一.场景分析: 1.限流:鉴于只有少部分用户能秒杀成功,所以要限制大部分流量,只允许少部分流量进入后端服务: 2. ...

  5. 双十二结束了,程序员如何设计一个秒杀系统?

    秒杀系统的关键点: 秒杀系统其实主要解决2个问题,一个是并发读,一个是并发写.整体概况为"稳.准.快" 高性能. 秒杀涉及大量的并发读和并发写,因此支持高并发访问这点非常关键.本文 ...

  6. 【学习笔记】秒杀系统架构设计

    秒杀其实主要解决两个问题 并发读 VS 并发写 并发读的核心优化理念是尽量减少用户到服务端来"读"数据,或者让他们读更少的数据 并发写的处理原则也一样,它要求我们在数据库层面独立出 ...

  7. 极客时间-如何设计一个秒杀系统-笔记0到2章

    极客时间-如何设计一个秒杀系统-笔记0到2章 0.开篇词-系统秒杀系统架构设计都有哪些关键点? 1.设计秒杀系统时应该注意的5个架构原则 1.数据要尽量少 2.请求数要尽量少 3.路径要尽量少 4.依 ...

  8. 敲黑板,也来谈如何设计一个秒杀系统(重点)

    1. Overview 1.1 并发读写 秒杀要解决的主要问题是:并发读与并发写. 并发读的优化理念是尽量减少用户到服务端来读数据,或者让他们读更少的数据:并发写的处理原则一样,要求我们在数据库层面独 ...

  9. 00 如何设计一个秒杀系统——秒杀系统架构设计都有哪些关键点

    一.如何理解秒杀系统 秒杀系统其实主要解决两个问题,一个是并发读,一个是并发写.并发读的核心优化理念是尽量减少用户到服务端来"读"数据,或者让他们读更少的数据:并发写的处理原则也一 ...

最新文章

  1. 个人易遗忘的代码记录(6) 汉字转拼音
  2. 17.容器的成员函数优先于同名的算法
  3. 用了四年的联想Thinkpad P50,今天还给公司了,拍个照留念
  4. eclipse juno_Eclipse Juno上带有GlassFish的JavaEE 7
  5. 是人是谁_其实,我们每个人心中都有一把尺子,谁好谁歹谁心里都明白……
  6. SPAN Switched Port Analyzer 单臂路由
  7. 计算机基础17秋在线作业3,南开17秋学期《计算机应用基础》在线作业3
  8. OpenSSL密码库算法笔记——第5.4章 椭圆曲线点的简介
  9. Talib技术因子详解(一)
  10. 舞蹈链算法与数独求解
  11. java 编写metro风格_纯Javascript实现Windows 8 Metro风格实现
  12. chromium目录下各个dll的作用
  13. 怎么恢复格式化的sd卡呢?
  14. fastdds交叉编译
  15. cs224w(图机器学习)2021冬季课程学习笔记16 Community Detection in Networks
  16. 用python实现FMM和BMM
  17. Unity基本认识——走进Unity
  18. SVN 服务端 和 客户端(转)
  19. 【软件测试的计划和策略】
  20. 马斯克为其五处房产申请6100万美元抵押贷款 每月还18万美元

热门文章

  1. 标准 IO 库的缓冲区
  2. Linux Openssh 生成https 证书
  3. Linux安装SqlServer[笔记]
  4. 数字IC笔试面试题目总结1_同步异步、竞争冒险
  5. matlab舍选抽样正态分布,采用第二类舍选抽样法产生标准正态分布
  6. 数据仓库项目——数据准备
  7. 【阅读】1235- 推荐2022前端必看的新书 《Vue.js设计与实现》
  8. Windows Azure SSTP模式×××配置
  9. 【目标检测】SSD目标检测
  10. Linux OR CentOS环境下安装go语言开发工具