欢迎跳转到本文的原文链接:https://honeypps.com/cache/cache-strategy-and-relative-merits-analysis/

今天翻译一篇关于缓存策略的文章,原文标题是Cacheing Strategies and How to Choose the Right One,同事推荐看的,觉得总结的不错,鉴于很多同学都懒得看英文的,所以皮皮就用蹩脚的水平试着翻译一波,如何觉得还凑合,记得点个“在看”,^-^。

缓存是提高系统性能的最简单方法之一。相对而言,数据库(or NoSQL数据库)的速度比较慢,而速度却往往又是制胜的关键。

如果使用得当,缓存可以减少相应时间、减少数据库负载以及节省成本。本文罗列了几种缓存策略,选择正确的一种会有很大的不同。缓存策略取决于数据和数据访问模式。换句话说,数据是如何写和读的。例如:

  • 系统是写多读少的吗?(例如基于时间的日志)

  • 数据是否是只写入一次并被读取多次?(例如用户配置文件)

  • 返回的数据总是惟一的吗?(例如搜索查询)

选择正确的缓存策略是提高性能的关键。让我们快速了解一下各种缓存策略。

第一种:Cache-Aside

这可能是最常用的缓存方法。缓存位于一边,应用程序直接与缓存和数据库对话。

简要解释一下:

  1. 应用程序首先检查缓存。

  2. 如果在缓存中找到,表示已经命中缓存。数据被读取并返回给应用程序。

  3. 如果在缓存中没有找到,则未命中缓存。应用程序必须做一些额外的工作,它需要查询数据库来读取数据,将数据返回给客户端,然后还要将数据存储在缓存中,这样对相同数据的后续读取可以命中缓存。

Cache-aside策略特别适合读多的应用场景。使用Cache-aside的系统对缓存失效具有一定的弹性。如果缓存集群宕机,系统仍然可以通过直接访问数据库进行操作。(不过,如果缓存在峰值负载期间下降,这也没有多大帮助。响应时间可能会变得很糟糕,最糟糕的情况是,数据库可能会停止工作。)

另一个优点在于缓存中的数据模型可以与数据库中的数据模型不同。例如,多个查询产生的响应可以存储在某个请求id上。

当使用cache-aside时,最常见的写策略是直接将数据写到数据库中。当这种情况发生时,缓存可能与数据库不一致。为了解决这个问题,开发人员通常会引入TTL,并继续提供陈旧的数据,直到TTL过期。如果必须保证数据的新鲜度,开发人员要么使缓存条目无效,要么使用适当的写策略,我们将在后面讨论。

第二种:Read-Though Cache

Read-though策略下的缓存与数据库保持一致。当缓存丢失时,它从数据库加载相应的数据,填充缓存并将其返回给应用程序(参考下图)。

cache-aside和read-through策略都是延迟加载数据的,也就是说,只在第一次读取数据时才加载数据。

虽然read-through和cache-aside非常相似,但至少有两个关键区别:

  1. 在cache-aside中,应用程序负责从数据库中获取数据并填充缓存。在read-through中,此逻辑通常由库或独立缓存提供程序支持。

  2. 与cache-aside不同,read-through cache中的数据模型不能与数据库中的数据模型不同。

当多次请求相同的数据时,read-through缓存最适合于读量较大的工作负载。例如,一个新闻故事。缺点是,当第一次请求数据时,它总是导致缓存丢失,并导致额外的数据加载到缓存的代价。开发人员通过手动发出查询来“预热”或“预热”缓存来处理这个问题。就像cache-aside一样,数据也可能在缓存和数据库之间变得不一致,而解决方案就在写策略中,我们将在接下来看到这一点。

第三种:Write-Through Cache

在这种写策略中,首先将数据写入缓存,然后写入数据库。缓存与数据库保持一致,写操作总是通过缓存到达主数据库。

在这种写策略中,首先将数据写入缓存,然后写入数据库。缓存与数据库保持一致,写操作总是通过缓存到达主数据库。

就其本身而言,write-through缓存似乎没有多大作用,实际上,它们引入了额外的写延迟,因为数据先写到缓存,然后写到主数据库。但是,当与read-through结合使用时,我们获得了read-through的所有好处,还获得了数据一致性保证,使我们不必使用缓存失效技术。

DynamoDB Accelerator (DAX)是write-through / read-through cache的一个很好的例子。它与DynamoDB和应用程序内联。对DynamoDB的读写可以通过DAX完成。(附注:如果您计划使用DAX,请确保熟悉它的数据一致性模型以及它如何与DynamoDB交互。)

第四种 Write-Around

这种策略下,数据直接写入数据库,只有读取的数据才能进入缓存。Write-around可以与read-through结合使用,并在数据只写一次、读取次数较少或从不读的情况下提供良好的性能。例如,实时日志或聊天室消息。同样,这个模式也可以与cache-aside组合使用。

第五种 Write-Back

这种策略下,应用程序将数据写入缓存,缓存会立即确认,并在延迟一段时间后将数据写入数据库。有时这种策略也被称为write-behind。

Write-back缓存提高了写性能,对于写工作量大的工作负载非常有用。当与read-through相结合的时候,它对于混合工作负载非常有效,最近更新和访问的数据总是在缓存中可用。它对数据库故障具有很大程度上的弹性,可以容忍一些数据库的宕机。如果支持批处理或合并,则可以减少对数据库的总体写操作,这将减少负载并降低成本。

一些开发人员使用Redis时,同时采用了cache-aside和write-back两种策略,以便更好地吸收峰值负载期间的峰值。主要缺点是,如果缓存失效,数据可能会永久丢失。大多数关系数据库存储引擎(例如InnoDB)的内部都默认启用了回写缓存。查询首先写入内存,最后刷新到磁盘。

总结

在本文中,我们探讨了不同的缓存策略及其优缺点。在实践中,请仔细评估您的目标,理解数据访问(读/写)模式,并选择最佳策略或组合策略。

如果你选错了怎么办?一个与你的目标或访问模式不匹配的?您可能会引入额外的延迟,或者至少没有看到全部的好处。例如,如果在实际应该使用write-around/read-through时选择write-through/read-through(访问写入数据的频率较低),那么缓存中就会有无用的垃圾。可以说,如果缓存足够大,它可能没问题。但在许多实际的高吞吐量系统中,当内存永远不够大并且需要考虑服务器成本时,正确的策略很重要。

希望你喜欢这篇文章。请在下面的评论部分告诉我,您在项目中使用了哪种缓存策略。

原文:https://codeahoy.com/2017/08/11/caching-strategies-and-how-to-choose-the-right-one/
作者:Umer Mansoor
译者:朱小厮的博客


欢迎跳转到本文的原文链接:https://honeypps.com/cache/cache-strategy-and-relative-merits-analysis/

想知道更多?描下面的二维码关注我

相关推荐:

  • 《科普 | 明星公司之Netflix》

  • 《看我如何作死 | 将CPU、IO打爆》

  • 《看我如何作死 | 网络延迟、丢包、中断一个都没落下》

  • 《7102-2019年技术文全套整理,建议收藏》

  • 《看我如何假死!》

>>>Learn More<<

点个"在看"呗^_^

总结缓存使用过程中的几种策略以及优缺点组合分析相关推荐

  1. BT源代码学习心得(十五):客户端源代码分析(下载过程中的块选取策略)

    BT源代码学习心得(十五):客户端源代码分析(下载过程中的块选取策略) 发信人: wolfenstein (NeverSayNever), 个人文集 标  题: BT源代码学习心得(十五):客户端源代 ...

  2. 面试过程中如何介绍自己?最大优缺点?加班?薪资?

    1.请你自我介绍一下你自己? 回答提示:一般人回答这个问题过于平常,只说姓名.年龄.爱好.工作经验,这些在简历上都有.其实,企业最希望知道的是求职者能否胜任工作,包括:最强的技能.最深入研究的知识领域 ...

  3. 进程在运行过程中的三种基本状态是什么?画出其转换图。

    进程三种基本状态 进程三种基本状态分别是就绪.执行和阻塞. 就绪状态 当进程已分配到除CPU以外的所有必要的资源,只要获得处理机便可立即执行,这时的进程状态称为就绪状态. 执行状态 当进程已获得处理机 ...

  4. mysql报错注入_关于Mysql注入过程中的三种报错方式

    放点原来的笔记,Mysql在执行语句的时候会抛出异常信息信息,而php+mysql架构的网站往往又将错误代码显示在页面上,这样可以通过构造如下三种方法获取特定数据. 实际测试环境: Default m ...

  5. DELL服务器安装过程中的三种模式AHCI, ATA, RAID

    BIOS 里的 SATA setting 有 AHCI mode, ATA mode, RAID mode三种模式. AHCI vs ATA ATA(AT Attachment) 是一个很久远的标准, ...

  6. 缓存优化过程中的一些思考

    最近一段时间在做双十一的优化,对于缓存的使用和改造渐渐有了一些思考,记录一下 缓存的使用.选择 * 读简单,写复杂的业务最好放在写入端 * 读复杂,写简单的业务逻辑放在读取端 * 根据业务的类型,选择 ...

  7. 戴尔服务器装新硬盘模式,DELL服务器安装过程中的三种模式AHCI, ATA, RAID

    BIOS 里的 SATA setting 有 AHCI mode, ATA mode, RAID mode三种模式. AHCI vs ATA ATA(AT Attachment) 是一个很久远的标准, ...

  8. vs2013在使用ef6时,创建模型向导过程中,四种模型方式缺少2种

    下载eftool,并安装 https://download.microsoft.com/download/2/C/F/2CF7AFAB-4068-4DAB-88C6-CEFD770FAECD/EFTo ...

  9. React中的四种样式使用优缺点比较

    1.组件化天下下的CSS css的设计就不是为组件化而生的,所以在目前组件化的框架中都在需要一种合适的CSS解决方式. 组件化中选择合适的CSS解决方案应该符合以下条件: 1.可以编写局部的css:c ...

最新文章

  1. k8s集群部署一(最新版docker安装)
  2. 某网SQL注入漏洞实战
  3. 全球顶会论文作者,28天手把手带你复现顶会论文
  4. 使用git pull文件时和本地文件冲突怎么办
  5. python pip下载安装教程_Python下的常用下载安装工具pip的安装方法
  6. SAP系统和微信集成的系列教程之四:如何将SAP C4C主数据变化推送给微信公众号的关注者
  7. Centos7 安装Go环境
  8. 被限高消费后,王思聪又有新动作:新增对外投资...
  9. 为了彻底理解乱码问题,一怒之下我把字符集历史扒了个底朝天
  10. 自制简易前端MVC框架
  11. python cookbook 学习笔记 -- 1.5 去除字符串两端空格
  12. java实现n选m组合数_求组合数m_n
  13. 华为鸿蒙os系统电脑有吗,华为全面启用鸿蒙OS系统!所有华为终端设备:默认搭载鸿蒙系统...
  14. 循证医学 计算机辅助决策系统,循证医学重点整理
  15. 屏幕录像专家的使用说明
  16. pg数据库表存放在哪里_pg数据库系统表
  17. Springboot定时任务、Quartz表达式
  18. 最新微信公众号怎么申请?
  19. 公有ip地址和私有ip地址_如何查找您的私有和公共IP地址
  20. 语音端点检测c语言,语音端点检测的方法.ppt

热门文章

  1. linux防火墙阻断目的,基于Linux防火墙的内部邮件监控与阻断系统
  2. 计算机领域中,增量是什么意思?
  3. Maven 配置文件 POM 的常用依赖配置代码
  4. 210314阶段三VS使用Linux 的sqlite3 API
  5. Linux运维系统工程师与java基础学习系列-6
  6. 为iptables开放新的网络端口
  7. CodeForces - 1207F Remainder Problem(分块)
  8. CodeForces - 484E Sign on Fence(主席树区间合并+二分)
  9. CodeForces - 1459C Row GCD(数论+推公式)
  10. CodeForces - 1437G Death DBMS(AC自动机fail树上树链剖分建线段树/暴跳fail)