羊年春晚,微信收发总数为10.1亿次红包,高峰期出现在00:00~00:02,瞬间峰值达到每分钟55万个红包被发出,165万个红包被拆开(更多数据请参考羊年春节微信数据大解析),这么大的数据量几乎没有出现宕机的情况发生,他们是如何做到的?让微信工程师为你讲述春晚红包的系统设计和优化。

  讲师:jeri

核心功能&目标

首先,了解下微信红包的4个逻辑:摇/发/抢/拆。看似简单,实现可不简单再review下微信红包要实现目标:

摇:摇的流畅

快:抢的要快

爽:拆的爽

稳:能分享出去

系统难点

1.中国运营商网络环境复杂,覆盖面广,春节期间网络吃紧,容易出现网络故障

2.在尖峰摇时如何避免服务雪崩

3.在服务资源有限时,如何提供柔性服务

4.如何构造有损服务

5.如何构造set模型

6.如何解决并发抢

7.如何实现实现数据一致性

系统整体架构图

跨区域网络解决方案

微信客户端分布全球,接入点较多,用户资料靠近接入点,可以加速用户资料访问,但是红包的业务逻辑层并不全网分布,业务逻辑层访问数据层比较多,数据层有状态强一致性问题,只能同用一个数据副本,比如上海用户与深圳用户在同个群里,抢同一个红包,如果订单数据在上海与深圳都有,在抢的时候,无法保证数据同步,可用性低,所以,设计系统时,一定要梳理清楚系统间的调用关系,优化接入层的业务逻辑,把网络耗时降到最小,系统吞吐量才能提升。

跨区域网络问题,在物理实施上,也需要有备份绕行的能力,这个可以在系统的底层框架中实现,当指定专线出现故障时,快速切换网络,恢复服务

如何构建有损服务

什么是有损服务?选择性牺牲一部分数据一致性和完整性从而保证核心功能绝大多数运行,经过一段时间窗口,数据一致性与完整性能得以恢复,这也是腾讯的一直运营策略,在有限资源前提下,量力而为,满足用户的核心需求

比如,春晚摇一摇,我们的核心点是摇/拆/分享,那系统的资源优先需要保证这些服务的响应,任何关联系统出现异常的时候马上进行系统降级,防止引起系统雪崩。

系统降级可以分为两个方面,一是把核心功能调用链路简化,减少依赖,通过辅助轻量化的服务实现,确保最短关键路径的可行,比方说在接入层置入摇红包逻辑,将每秒千万级请求转化为每秒万级的红包请求,再传到红包服务的后端逻辑,降低雪崩的可能性。

柔性服务.打造好的产品体验

柔性可用是在有损服务价值观支持下的方法,重点在于实际上会结合用户使用场景,根据资源消耗,调整产品策略,设计几个级别不同的用户体验场景,保证尽可能成功返回关键数据,并正常接受请求,绝不轻易倒下。

比如,红包的核心功能拆,拆完需要记录用户头像昵称,转帐资金划转,同时输出同个订单下其它拆记录,拆过程这些操作都可能失败,但是核心操作获取红包是成功的,此时,我们至少可以告诉用户抢到金额,不至于让用户焦急等待,不断重试,未完成的操作(头像补全与资金转帐),可以通异步补尝方式重试。这样解决了用户的问题,也缓解了系统压力。

如果构造set模型

Set模块就像一个集装箱,把各模块标准化,模块化,规模化,它为海量服务运营,特别是设备管理、网络架构,提供了宏观运营支撑框架,从而极大提高了海量服务运营效率。

微信红包的set模块,以拆服务为例,从接入层开始,数据开始sticky,按订单号路由,即按单号分set,同一个set尽可能在一个IDC 里,减少模块间调用的耗时,在同一个set内,逻辑层任何一台机器,调用方可实时摘除,如果是数据层发生故障,先在接入层,把新产生的红包订单号屏蔽有故障对应的set编号,比如,set1 数据库出现故障,为了避免在故障的set1 上继续产生新的支付请求,在订单生成器直接跳过set1的单号规则,把新请求导致其它set, 只有未抢完的部分红包,会提示故障,稍后恢复,阻止了故障引发的进一步恶化,在故障db上的数据,通过备机与业务逻辑层的数据核对,完成数据一致性的修复。

如何解决并发抢

群里红包的规则是金额随机抢,在一个大群发一个红包出去,抢并发请求量高,在同一个资源上操作,需要增加锁操作,避免一个抢总数超过发送红包总数,众所周所,mysql的加锁操作,很多抢在一个锁上等,性能损耗大,吞吐量下降,对于海量服务的操作,是不能满足要求。

在set模块的基础上,我们把发/抢的资源请求都会落到同一个资源set,在最外层,cache红包的状态,如果红包已经被抢完了,即刻返回,如果红包未接完,对于一个红包进去抢环节还有限流,这是第一级保护,通过一致性hash算法,一一个单到dao层都会路由到同一个机器的同一个进程,dao到mysql在现一个连接上完成抢操作,把并发抢修改成串行化,mysql可以无锁等待,性能明显提升。

如何实现数据一致性

谈到分布式系统,先回顾CAP理论

C:Consistency数据一致更新,所有变动都是同步的

A:高可用,好的响应性能

P: 分区容忍,可靠性

在我们的系统设计中,同样碰到这个问题,无法同时满足三个因子,移动互联网系统,高可用性是必要要求,数据分区也是分布式系统的条件,所以,我们设计系统时,只能尽量保证数据一致性,只要一定时间窗口内,完成数据一致,让用户满意。

微信红包的数据有几份,订单数据,用户数据,还有对应的cache数据,

N:数据副本份数红包有三份

R: 一次需读取的副本红包一次从一个副本可以全部读取需要数据

W: 一次写入数据2份实时写,一分异步化

R(1) + W(2) <=N从公式算出,我们的数据模型也是弱一致性

用户数据是异步更新,更新失败,通过消息中心,异步重试,根据DB资源负载设置调用方的调用阀值,除了实时重试,我们还有准实时数据核对,保证数据最终一致性。

微信工程师为你讲述春晚红包的系统设计和优化相关推荐

  1. 百度春晚红包分享链接遭微信屏蔽 已有超700人集齐好运卡

    [TechWeb]1月29日,今年百度和2019年"春节联欢晚会"达成独家互动合作,春晚大家可以用包括百度app在内的多款百度系app来抢红包. 作为预热,昨天百度app启动了&q ...

  2. 微信推视频红包;百度春晚红包互动 137 亿次;谷歌用皮影庆猪年 | 极客头条...

    「CSDN 极客头条」,是从 CSDN 网站延伸至官方微信公众号的特别栏目,专注于一天业界事报道.风里雨里,我们将每天为朋友们,播报最新鲜有料的新闻资讯,让所有技术人,时刻紧跟业界潮流. 快讯速知 视 ...

  3. 微信解封百度春晚红包

    据Bianews报道,今日发现百度春晚红包链接可以在朋友圈分享.也可与微信好友分享.此前,百度春晚红包链接无法在微信中分享.微信称百度活动页面里有诱导邀请分享给好友的相关内容,微信对其中4个违规活动页 ...

  4. 谷歌 I/O 2019 将于 5 月 7 日举办;百度春晚红包被微信封杀

    (给技术最前线加星标,每天看技术热点) 转自:开源中国.solidot.cnBeta.腾讯科技.快科技等 [技术资讯] 0.Google I/O 2019 将于 5 月 7 日举办 北京时间1月26日 ...

  5. 一个“扛住100亿次请求”的春晚红包系统

    文章来源:https://sourl.cn/wRp68e 前 言 偶然看到了<扛住100亿次请求--如何做一个"有把握"的春晚红包系统>一文,看完以后,感慨良多,收益很 ...

  6. 用 Go 重构 C 语言系统,这个抗住春晚红包的百度转发引擎承接了万亿流量

    整理 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 11 月 20 日,百度的万亿流量转发引擎 BFE 登上了 GitHub Trending Top 3,今日 Star 已突破 2 ...

  7. 扛住100亿次请求——如何做一个“有把握”的春晚红包系统

    戳蓝字"CSDN云计算"关注我们哦! 作者 | xiaojiaqi 责编 | 阿秃 前几天,偶然看到了 <扛住100亿次请求--如何做一个"有把握"的春晚 ...

  8. 扛住 100 亿次请求—如何做一个“有把握”的春晚红包系统?

    点击上方"Java精选",选择"设为星标" 别问别人为什么,多问自己凭什么! 下方有惊喜留言必回,有问必答! 每天 13:30 更新文章,每天进步一点点... ...

  9. 用Go重构C语言系统,这个抗住春晚红包的百度转发引擎承接了万亿流量

    整理 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 11 月 20 日,百度的万亿流量转发引擎 BFE 登上了 GitHub Trending Top 3,今日 Star 已突破 2 ...

  10. 百度发的208亿春晚红包,靠这样的技术送到了你手上 | 解读

    2019 年的春晚红包项目对百度而言是一次大考,背后需要强大的技术来支撑.如你所见,百度不负"技术大厂"的标签,春晚红包期间系统稳定运行,没有出现宕机事故.在这样一个庞大而复杂的项 ...

最新文章

  1. 第二周 数据分析之展示 Matplotlib基础绘图函数实例
  2. ICCV 2017 《Online Video Object Detection using Association LSTM》论文笔记
  3. python打印倒等腰梯形,Linux使用shell脚本做的菱形等一些益智题
  4. Java查看class的JVM,指令集文件--javap -c ClassName
  5. 使用开票组件快速开具清单发票
  6. office出错怎么简单修复
  7. matlab与zemax,如何在ZEMAX和MATLAB之间通信
  8. Python requests常用的浏览器头部
  9. Excel 转置分组时如何保留没有对应数据的空组
  10. 转载_Feedforward ANC 主动降噪原理
  11. 关于印发《2000国家大地坐标系推广使用技术指南》和《大地测量控制点坐标转换技术规程》的函
  12. 印度软件与信息服务业发展经验及启示
  13. 【中科大软院】还香不香?20软院考研四千字复盘
  14. Nature综述:鸟枪法宏基因组-从取样到数据分析——2万字带你系统入门宏基因组实验和分析
  15. InputStream (输入流) 与 OutputStream (输出流) 转换
  16. 【正点原子FPGA连载】 第二十八章OV5640 DP显示实验 摘自【正点原子】DFZU2EG_4EV MPSoC之嵌入式Vitis开发指南
  17. sincerit little w and Soda(规律题)
  18. NirCmd v2.37帮助文档中文译本
  19. linux命令简化,Linux ls 命令实现(简化版)
  20. C/C++陷阱与套路

热门文章

  1. 问题解决:Unlink of the file ‘.git/objects/pack/….idx’ failed. Should I try again?
  2. PHP中的session分析与使用
  3. 梦笔记2022-2-10
  4. MAC编译:fatal error: ‘endian.h‘ file not found
  5. 开源的胜利:意大利法院判定开源协议条款可强制执行
  6. 用shell把所有文件名修改为小写
  7. LINUX下载编译YASM
  8. 热烈祝贺排名进入前1000
  9. 遇到ffmpeg错误:non monotonically increasing dts to muxer in stream
  10. SmartSVN报错format的解决办法