相关阅读:

BAT等大厂十年研发经历,总结了12开发条经验(墙裂推荐)

漫画:“架构师”小赵的故事

互联网技术(java框架、分布式、集群)干货视频大全,不看后悔!(免费下载)

为大家奉上一篇投稿,来自《深入分布式缓存》这本书。曾记得当年,现任某海外电商CTO对我说,互联网架构有两大神器,一个是缓存,一个是MQ,整明白就能搞定高并发海量业务场景。如今终于有了一本专门讲缓存的书,也许MQ的已经在路上了。


在Feed系统中,有简单数据类型的缓存,有集合类数据的。还有一些个性业务的缓存。比如大量的计数器场景,存在性判断场景等。微博解决存在性判断业务的缓存层叫EXISTENCE 缓存层,解决计算器场景的缓存叫COUNTER缓存。

EXISTENCE 缓存层主要用于缓存各种存在性判断的业务,诸如是否已赞(liked)、是否已阅读(readed)这类需求。

Feed系统内部有大量的计数场景,如用户维度有关注数、粉丝数、feed发表数,feed维度有转发数、评论数、赞数以及阅读数等。前面提到,按照传统Redis、Memcached计数缓存方案,单单存每日新增的十亿级的计数,就需要新占用百G级的内存,成本开销巨大。因此微博开发了计数服务组件CounterService。下面以计数场景来管中窥豹。

提出问题

对于计数业务,经典的构建模型有两种:1 db+cache模式,全量计数存在db,热数据通过cache加速;2全量存在Redis中。方案1 通用成熟,但对于一致性要求较高的计数服务,以及在海量数据和高并发访问场景下,支持不够友好,运维成本和硬件成本较高,微博上线初期曾使用该方案,在Redis面世后很快用新方案代替。方案2基于Redis的计数接口INCR、DECR,能很方便的实现通用的计数缓存模型,再通过hash分表,master-slave部署方式,可以实现一个中小规模的计数服务。

但在面对千亿级的历史海量计数以及每天十亿级的新增计数,直接使用Redis的计数模型存在严重的成本和性能问题。首先Redis计数作为通用的全内存计数模型,内存效率不高。存储一个key为8字节(long型id)、value为4字节的计数,Redis至少需要耗费65字节。1000亿计数需要100G*65=6.5T以上的内存,算上一个master配3个slave的开销,总共需要26T以上的内存,按单机内存96G计算,扣掉Redis其他内存管理开销、系统占用,需要300-400台机器。如果算上多机房,需要的机器数会更多。其次Redis计数模型的获取性能不高。一条微博至少需要3个计数查询,单次feed请求如果包含15条微博,仅仅微博计数就需要45个计数查询。

解决问题

在Feed系统的计数场景,单条feed的各种计数都有相同的key(即微博id),可以把这些计数存储在一起,就能节省大量的key的存储空间,让1000亿计数变成了330亿条记录;近一半的微博没有转、评论、赞,抛弃db+cache的方案,改用全量存储的方案,对于没有计数为0的微博不再存储,如果查不到就返回0,这样330亿条记录只需要存160亿条记录。然后又对存储结构做了进一步优化,三个计数和key一起一共只需要8+4*3=20字节。总共只需要16G*20=320G,算上1主3从,总共也就只需要1.28T,只需要15台左右机器即可。同时进一步通过对CounterService增加SSD扩展支持,按table滚动,老数据落在ssd,新数据、热数据在内存,1.28T的容量几乎可以用单台机器来承载(当然考虑访问性能、可用性,还是需要hash到多个缓存节点,并添加主从结构)。

计数器组件的架构如图13-14,主要特性如下:

1)  内存优化:通过预先分配的内存数组Table存储计数,并且采用 double hash 解决冲突,避免Redis 实现中的大量指针开销。

2)  Schema支持多列:一个feed id对应的多个计数可以作为一条计数记录,还支持动态增减计数列,每列的计数内存使用精简到bit;

3)  冷热数据分离,根据时间维度,近期的热数据放在内存,之前的冷数据放在磁盘,降低机器成本;

4)  LRU缓存:之前的冷数据如果被频繁访问则放到LRU缓存进行加速;

5)  异步IO线程访问冷数据:冷数据的加载不影响服务的整体性能。

图 13-14 基于Redis扩展后的计数器存储架构

通过上述的扩展,内存占用降为之前的5-10%以下,同时一条feed的评论/赞等多个计数、一个用户的粉丝/关注/微博等多个计数都可以一次性获取,读取性能大幅提升,基本彻底解决了计数业务的成本及性能问题。

看完本文有收获?请转发分享给更多人


欢迎关注“互联网架构师”,这里是聚集了10W+技术的架构师圈子,我们分享最有价值的互联网技术干货文章,助力您成为有思想的全栈架构师,我们聊互联网、聊架构,聊人生,聊职场,助你最快进阶!打造最有价值的架构师圈子和社区。

本公众号覆盖中国主要首席架构师、高级架构师、CTO、技术总监、技术负责人等人 群。分享最有价值的架构思想和内容。打造中国互联网圈最有价值的架构师圈子。

  • 长按下方的二维码可以快速关注我们

  • 如想加群讨论学习,请点击右下角的“加群学习”菜单入群

微博每日数十亿级业务下的计数器如何扩展Redis?相关推荐

  1. 十亿级流量下,我与Redis时延小突刺的战斗史

    作者:vivo互联网服务器团队-Wang Shaodong 一.背景 某一日收到上游调用方的反馈,提供的某一个Dubbo接口,每天在固定的时间点被短时间熔断,抛出的异常信息为提供方dubbo线程池被耗 ...

  2. 第五章 业务架构,5.5 菜鸟双11“十亿级包裹”之战(作者:兰博)

    5.5 菜鸟双11"十亿级包裹"之战 前言 每年的双11都在刷新物流的世界奇迹,但由于大数据和协同,每次都将看似不可能完成的任务加速完成.以2013年-2016年的一组数据为例,从 ...

  3. 重磅:腾讯正式开源图计算框架Plato,十亿级节点图计算进入分钟级时代

    整理 | 唐小引 来源 | CSDN(ID:CSDNnews) 腾讯开源进化 8 年,进入爆发期. 继刚刚连续开源 TubeMQ.Tencent Kona JDK.TBase.TKEStack 四款重 ...

  4. 腾讯开源图计算框架 Plato:十亿级节点图计算进入分钟级时代

    日,腾讯开源再次迎来重磅项目.14 日,腾讯正式宣布开源高性能图计算框架 Plato,这是在近一周之内,开源的第五个重大项目.前面依次开源了 TubeMQ.Tencent Kona JDK.TBase ...

  5. 十亿级视频播放技术优化揭密

    本文为转载文章,文章来自:王辉|十亿级视频播放技术优化揭密 QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦.北京.东京.纽约.圣保罗.上海.旧金山召开.自 2007年 3月份首次举办以来,已 ...

  6. 腾讯正式开源图计算框架Plato,十亿级节点图计算进入分钟级时代

    腾讯开源再次迎来重磅项目,14日,腾讯正式宣布开源高性能图计算框架Plato,这是在短短一周之内,开源的第五个重大项目. 相对于目前全球范围内其它的图计算框架,Plato可满足十亿级节点的超大规模图计 ...

  7. 原创精华:剖析亿级请求下的多级缓存

    什么是多级缓存 所谓多级缓存,即在整个系统架构的不同系统层级进行数据缓存,以提升访问效率,这也是应用最广的方案之一.我们应用的整体架构如图1所示: 图1 多级缓存方案 整体流程如上图所示: 1)首先接 ...

  8. 百度十亿级流量的搜索前端,是怎么做架构升级的?

    Harttle 百度资深研发工程师,北京大学物理学学士和计算机科学硕士.2016年加入百度,曾负责和参与百度搜索Web极速浏览框架.MIP开源项目的研发,目前负责搜索结果页和搜索推荐业务.Liquid ...

  9. 腾讯研发总监王辉:十亿级视频播放技术优化揭秘

    QQ 空间在 2016 年日均视频播放量由年初的千万级迅速突破到十亿级,过程中也对整个视频播放技术的可靠性.性能.操作体验等方面提出严峻的考验,相关质量急需提升.经过多个迭代持续和各项优化,外网整体质 ...

  10. 腾讯云十亿级 Node.js 网关的架构设计与工程实践

    作者|王伟嘉 编辑|孙瑞瑞 本文由 InfoQ 整理自腾讯云 CloudBase 前端负责人王伟嘉在 GMTC 全球大前端技术大会(深圳站)2021 上的演讲<十亿级 Node.js 网关的架构 ...

最新文章

  1. ubuntu12.04升级php5.4至。。5.5
  2. 第十六届智能车竞赛创意组比赛-筹划初稿
  3. zookeeper集群配置与配置文件详解
  4. 静态函数调用非静态函数的小例子
  5. 计算机一级发邮件发送多个抄送,计算机一级考试IE题和收发邮件模拟题.docx
  6. MongoDB与Spring集成教程
  7. leetcode 整数反转
  8. terminal mysql 停止_转载MySQL之终端(Terminal)管理MySQL
  9. 百度回应“抄袭天猫精灵”;ofo 押金退完需 12 年;VS Code 1.36 发布 | 极客头条...
  10. iptables的应用
  11. C++学习008-delete与delete[]的差别
  12. WIFI的下一代:LIFI 可见光无线通信代替微波通信
  13. 读书笔记-《程序员成长课》
  14. Python分组百分比排名
  15. linux usb有线网卡驱动_Linux USB网卡驱动安装
  16. CCNet:Criss-Cross Attention for semantic Segmentation
  17. craftsmanship中文_欢迎访问叶登民简体中文主页!
  18. 全国大学生物联网设计竞赛作品 | 智慧养鸡小助手
  19. 数论学习笔记1之积性函数与线性筛求积性函数
  20. 1.1 区块链专业术语(中英对照)

热门文章

  1. java多线程——CAS
  2. pom.xml中添加oracle数据库驱动包报错: Missing artifact com.oracle:ojdbc14:jar:10.2.0.4.0
  3. 论模式在领域驱动设计中的重要性
  4. 临时开启PHP错误提示
  5. NetscalerSSL证书的导入和link
  6. 解决异常:公共语言运行时检测到无效的程序
  7. Lightroom Classic 教程,如何在 Lightroom 中使用引导式修复透视图?
  8. PHPStorm Mac如何利用MAMP配置php?
  9. JAVA-Servlet操纵方法
  10. WGestures鼠标手势快捷手势介绍