前言:

各家互联网公司每年都有印有自己图腾的重大活动,例如天猫的双十一、京东的六幺八、芒果TV的跨年晚会等。这些活动不仅会带来流量的激增,同时活动的成败也几乎决定了产品线研发运维人员的荷包收益。所以每当这种大型在线实时应用活动到来时,公司都会提前一个月组成临时战斗小组全力研究各种解决方案,本文我就基于自己的理解从宏观上进行分析和讲解。

1全链路监控解决方案

全链路监控是最重要也是时间维度上最先要进行的工作,从客户端接收到服务请求到http层经过哪些服务节点的跳迁,到提供服务的API依赖了哪些Paas层的组件,再到web服务和Pass层组件落到了哪些Iaas层实例上,只有捋清楚它们的关系,才有条件做链路的分析和优化。

全链路监控的目的是为了做到3个“有”:

1.1事前有预案

经过监控分析后发现风险所在,提前准备各种风险出现时的解决方案。

1.2事中有手段

只有预案还不够,因为活动中可能会发生各种不可预测的问题,需要提前准备好脚本、工具等批量操作手段,当危机爆发时可以最快速度进行处理。

1.3事后有分析

活动结束后进行复盘,积累经验,修正不足,为来年的活动做知识储备。

2全链路压测解决方案

这里特别强调的是一定是对真实生产环境进行压测,因为只有对接真正的活动当天的服务器资源、数据库资源、Redis和MQ资源等才能真实的评估出全链路的性能情况,才能有针对性的去进行补足。

全链路压测的难点在于数据挡板,也就是说如何避免压测数据污染到生产数据,一般常用的手段是影子表和影子请求,当压测结束后直接将影子表删掉就好。

3服务器高可用解决方案

服务的可靠性我们可以划分为4个等级:

3.1 单点故障

这个很好理解,不必多说

3.2 异机容灾

比单点好一点,不能解决机房停电、光纤挖断等带来的服务不可用

3.3 异地多活

最常用的可靠性等级,对服务器进行多个地区的部署,属于云平台的标准功能,土豪可以搭建异地的IDC

3.4 混合云异地多活

这个应该是目前可靠性最高的解决方案,在不同云厂商不同的地区都部署服务,只要地球不毁灭服务器就不会出问题。当然这种设计的成本也是巨大的,冗余的云实例、网络专线、跨云的数据交互中心等,都需要投入真金白银。

4应用高可用解决方案

每个服务节点前面已经介绍过如何做到高可用性,这里的应用高可用性主要针对整个服务调度网络来说的,不能因为个别应用出现问题而影响到整个任务链,需要做好服务降级和熔断的备案。

5重点保护/高级护航

首先要找到活动中自己的核心服务,例如芒果跨年晚会,核心服务就是视频直播、会员注册、充值这3个,因为这三个服务里有一个出现问题,那跨年活动就失去了意义。剩下的弹幕啊、节目评论啊、蓝光啊出现点问题是可以接受的。

找到这些重点保护服务后就要启动高级护航了,例如抽调全公司最强的技术人员组成专家组、付费对外寻求support、从战略合作伙伴那里获得技术支持等。目的只有一个,不管发生任何事情,我的重点服务不允许出现故障,这是本次大型活动的底线。

大型在线实时应用解决方案相关推荐

  1. anyRTC 重磅推出在线实时 K 歌解决方案

    在线音乐领域一直是各大资本巨头投资的热点,从抢占版权到现在的"云上之争", 主流平台的战火从版权资源转向创新领域扩延.而如今,在线K歌正在成为抢占"云音乐"市场 ...

  2. 看见·先行者 | 织音App率先接入即构在线KTV实时合唱解决方案

    "即构的实时合唱方案让我们眼前一亮!在这个方案的支持下,我们将会给用户带来更好的体验,敬请期待!"织音App产品总监丁云龙表示. 4月12日,即构科技发布行业首创"在线K ...

  3. 真实时在线K歌,全音乐版权支持|网易云信一体化实时合唱解决方案有一套!...

    在线K歌:井喷式增长的新社交 随着互联网技术与网络音乐的发展,在线K歌这种新兴的声音社交方式越来越为人熟知,短短几年内便积累了大量的拥趸:据统计,截至2018年,在线K歌行业设备数已超过2亿,网民渗透 ...

  4. 教育场景下的实时音频解决方案

    本文来自网易云信 资深音频算法工程师 李备在LiveVideoStackCon 2018讲师热身分享,并由LiveVideoStack整理而成.在分享中李备详细分析了在线教育的音频需求,以及一般软件音 ...

  5. 大型网站高并发解决方案——集群

    文章目录 大型网站高并发解决方案--集群 前言 一.集群 1.集群的分类 2.负载均衡集群(LB) (1)负载均衡集群结构 (2)负载均衡设备分类 3.高可用集群(HA) 4.高性能运算集群(HPC) ...

  6. 油品调和计算软件_油品调合利器——中控supBlend油品在线优化调合解决方案

    随着国家对石油产品(汽油.柴油以及燃料油)质量升级的逐步推进,石化企业传统的油品调合生产方式已经难以适应日益严苛的质量要求.因此,基于在线质量分析和先进过程控制的"油品在线优化调合" ...

  7. 基于 Flink 的超大规模在线实时反欺诈系统的建设与实践

    在大数据时代,金融科技公司通常借助消费数据来综合评估用户的信用和还款能力.这个过程中,某些中介机构会搜集大量的号并进行"养号"工作,即在一年周期里让这些号形成正常的消费.通讯记录, ...

  8. 基于X-Engine引擎的实时历史数据库解决方案揭秘

    实时历史库需求背景 在当今的数字化时代,随着业务的迅速发展,每天产生的数据量会是一个惊人的数量,数据库存储的成本将会越来越大,通常的做法是对历史数据做归档,即将长期不使用的数据迁移至以文件形式存储的廉 ...

  9. 基于Flink的超大规模在线实时反欺诈系统的建设与实践

    作者:关贺宇 在大数据时代,金融科技公司通常借助消费数据来综合评估用户的信用和还款能力.这个过程中,某些中介机构会搜集大量的号并进行"养号"工作,即在一年周期里让这些号形成正常的消 ...

最新文章

  1. 深度丨MIT重磅报告:一文看清AI商业化现状与未来
  2. 这5家纳米技术公司正在推动医疗检测的变革
  3. 【caffe解读】 caffe从数学公式到代码实现1-导论
  4. tsp 分支界限 java_干货 | 10分钟教你用branch and bound(分支定界)算法求解TSP旅行商问题...
  5. 星露谷物语json_星露谷物语 NPC地图显示MOD 怎么让地图显示NPC
  6. 基于 Consul 实现 MagicOnion(GRpc) 服务注册与发现
  7. win10控制视频声音大小
  8. 进程的挂起以及可重入函数
  9. 前端2018年12月9日 前端开发路上的小白心得--励志当个领路人
  10. CSS 制作垂直导航
  11. 服务器连接池怎么配置文件,服务器连接池怎么配置
  12. 有关Kill Session问题的讨论(旧文初发)
  13. 蚌埠计算机学校招生,蚌埠高级技工学校招生政策
  14. Photoshop数位板无压感解决方法
  15. ArcGIS矢量图层面积计算方法
  16. 2020年裸辞的人,真的待业了一整年吗?
  17. java-微信语言amr文件转码为Mp3文件
  18. 计算机变成英语,原来是中文的电脑电脑系统变成英文了
  19. Facebook广告效果数据获取
  20. win,linux双系统开机引导修复

热门文章

  1. java happen-before_java 内存模型中的happen-before 是什么?
  2. 【POI2005】SZA-Template(KMP)
  3. Flutter架构图
  4. JavaScript实现注册功能
  5. Linux按键响应测试
  6. 读取本地文件转化成MultipartFile
  7. photoshop旋转图片
  8. 技术团队人员管理:如何快速的组建团队
  9. CCD相机模数转换芯片时序简介
  10. 小白学习MySQL - 不同版本创建用户的些许区别