RAM缓存

新RAM缓存算法(CLFUS)

新的RAM缓存使用的创意来自许多缓存替换策略和算法,包括LRU,LFU,CLOCK,GDFS及2Q,它被命名为时钟周期内最小频繁使用大小算法CLFUS(Clocked Least Frequently Used by Size)。它避开了任何专利算法,具有如下特性:

  • 均衡最近性(Recentness),频率(Frequency)和大小(Size)以最大化命中率(hit byte,不是字节命中率byte hit rate)
  • 耐扫描(scan resistant),命中率提取可靠,即使工作集并不适应RAM Cache
  • 支持3级压缩率: fastlz, gzip(libz库)和xz(liblzma库),压缩工作可以移至另外一个线程处理
  • 非常低的CPU开销,仅略高于基础的LRU,没有使用O(lgn)堆,而是使用O(1)成本的概率替换策略(probabilistic replacement policy)
  • 相对低的内存开销,内存中的每个对象平均大约200字节

强调命中率而不是字节命中率的合理性,是因为从次级存储设备(硬盘)读取更多字节的开销(overhead)较之一个请求的成本(cost)更低。

RAM缓存由最前面的两个LRU/CLOCK对象哈希链表和一个seen哈希表组成。第一个缓存链表包含内存中的对象,但是第二个链表包含了近来放入缓存中或者打算放入缓存中的对象的历史信息(history of objects),seen哈希表用来使算法耐扫描。

下表中的元素(对应源码中的RamCacheCLFUSEntry)记录了下面的信息:

  • key
    16字节的唯一对象标识符
  • auxkeys
    相当于8字节的版本号(系统中分区的块),当对象的版本号改变时,旧元素将从缓存中删除掉
  • hits
    当前时钟周期内的命中数
  • size
    缓存中对象的大小,包括填充
  • len
    对象的实际长度,因为压缩和填充的原因,和size有区别。
  • compressed_len
    对象压缩后的长度
  • compressed
    压缩类型,可能的值是fastlz, libz和liblzma,不可压缩时值为none
  • uncompressible
    true表示对象内容可以压缩,false表示不可压缩
  • copy
    对象是否应该复制进来或复制出去(比如,HTTP HDR)
  • LRU link
    所在的LRU链表,有两个(cached list和history list)
  • HASH link
    所在bucket的双链表
  • IOBufferData
    数据缓存(data buffer)的智能指针

缓存接口是Get和Put操作,Get操作检查一个对象是否在缓存中,在将要读取时调用,Put操作决定是否将给定的对象放入缓存中,它在从磁盘中读取对象后调用。

RamCacheCLFUS::get伪代码算法分析:
if X is in cached list thenmove X to the tail of cached list, and return the data in X
else if X is in history list thenmove X to the tail of history list"cache miss"
else"cache miss"
end ifRamCacheCLFUS::put伪代码算法分析:
if X is in cached list thenmove X to the tail of cached list, and update its data
else if X is in history list thenif cached list has room to place X theninsert X to the tail of cached list, and update its dataelsecreate list Vdo                  pop one page Y from cached list//simulate the aging algorithm, for avoiding cache pollution pop one page Z from history listif HIT_VALUE(Z) is not greater than 1 thendelete Zelse let the HIT_VALUE(Z) with 1, and reinserted Z to the tail of history list   end if//endif CACHE_VALUE(X) is greater than CACHE_VALUE(Y) then push it to Velse insert X to the tail of history list and update its data, returnend ifutil cached list has enough room for placing Xend dofor(Z in V)if cached list has room for both Z and X, then reinsert Z to the tail of cached listinsert X to the tail of cached list, and update its dataend ifend forend if
else // X is neither in history list nor in cached list//judge X is or not first accessed by seen hashif X is first accessed and history list has no room for it, thensave the record of X in seen hashelseinsert X to the tail of history listend if
end if

Seen Hash

ATS冷启动后,Cached链表和History链表填满,将激活Seen链表。该链表的作用是缓存耐扫描,这意味着,经过对缓存中只见到一次的对象们做一长串的Get和Put操作,缓存状态一定不能受到影响。这是最本质的,如果没有这点保证,不仅缓存会受到污染,而且会丢失它所关注的对象相关的重要信息。所以,Cache链表和History链表不会受到第一次见到的对象上的Put操作和Get操作的影响是非常关键的。Seen Hash维护着一个16比特哈希标签(hash tags)的集合,未命中对象缓存(Cache链表和History链表中的)的请求,以及不匹配哈希标签的请求,导致哈希标签被更新,否则会被忽略。Seen Hash的大小近似缓存中的对象数,为了匹配用Cached链表和History链表的CLOCK率传给它的个数。

Cached List

Cached链表含有实际在内存中的对象,基本操作就是LRU,新对象插入FIFO队列中,命中导致对象被重新插入链表尾部。当要考虑插入一个对象时,会有一个有趣的bit位,首先检查对象哈希去看对象是否在Cached链表或者History链表中。命中意味着更新hit域并重新插入对象到链表尾部。History命中导致hit域被更新,然后比较对象是否保存在内存中。比较基于Cached链表中的最近最少使用元素,并基于一个加权频率:

CACHE_VALUE = hits / (size + overhead)

该公式类似GDFS算法,用于计算对象的缓存值,这里hits是请求对象的命中率,size是该对象的大小,overhead是一个加权值,在代码中设置为256。该公式从直观上比较易于理解,那些访问次数多的小对象将会更易于进入RAM中,这比较符合事实。
新对象必须有足够的字节值得当前缓存的对象去覆盖它。每次,当一个对象被认为可替换时,CLOCK就向前移动。假如History对象的值更大,就将它插入Cached链表,被替换的对象从内存中移除,并插入到History链表中。视作替换(至少一个)但还没有替换的对象,它们的hits域设为0,被重新插入Cached链表中,这就是Cached链表上的CLOCK操作。

History List

每个CLOCK操作时,History链表中的最少最近使用的元素被取出,假如hits域不超过1(History链表和Cached链表中至少命中一次)将被删除。否则,hits域设为0,被重新放入History链表中。

压缩和解压

压缩被后台操作执行(当前称作Put操作的一部分),后台操作维护了一个指向Cached链表的指针,并向头部正在压缩的元素前进。在Get操作过程中,解压根据要求进行。当对象被标记为copy时,压缩版本将被再次插入LRU中,因为我们需要做一次拷贝,没有标记为copy的那些对象被插入未压缩LRU中,希望它们能以未压缩形式重用。有一个编译时间选项,或许是我们想改变的东西。

下面是三种压缩算法和级别的对比(在Intel i7 920系列CPU上使用单线程测试)

这些都是粗略数字,你的测试结果可能相差很大。比如说,JPEG并不会用上述任何一种算法压缩(或者至少只会在个别级别做这种测试,压缩和解压成本完全没有说服力),对其它许多嵌入某种压缩形式的媒体和二进制文件类型也是如此。RAM缓存探测不到具体的压缩级别,假如压缩后的文件大小不能达到原来大小的90%以下,RAM缓存就认为该文件是不可压缩的,并将这个值缓存下来,RAM缓存不会企图再去压缩它(至少在history中的这段时间内)。

参考文献

https://docs.trafficserver.apache.org/en/latest/developer-guide/architecture/ram-cache.en.html
http://blog.chinaunix.net/uid-23242010-id-147401.html
http://blog.chinaunix.net/uid-23242010-id-147989.html

ATS中的RAM缓存简介相关推荐

  1. 利用python获取指定url在ATS中缓存对象的信息

    业务需求 给定url,如何查询指定的ATS中是否有该url的缓存对象信息?如果缓存了的话,希望提供该缓存对象的大小,缓存时间,缓存文件名,缓存份数(document alternative)等等信息 ...

  2. ATS 5.3.0缓存架构

    下面是参考文献[1]的翻译 简介 ATS既可以用作HTTP代理,也可以用作HTTP缓存,ATS能够缓存任何字节流,虽然它当前只支持HTTP协议传输的字节流,当这样的流缓存时,会带一个HTTP协议头部, ...

  3. FPGA逻辑设计回顾(11)FPGA以及PC中的RAM与ROM

    文章目录 前言 RAM以及ROM在计算机中的应用 什么是存储器? 什么是硬盘驱动器? 其他类型的存储器 什么是RAM? RAM的类型 SRAM DRAM 什么是ROM? ROM的类型 掩膜ROM PR ...

  4. 手写Verilog用FPGA实现实时图像卷积,用Block Ram缓存图像

    手写Verilog用FPGA实现实时图像卷积,用Block Ram缓存图像_哔哩哔哩_bilibili可用于神经网络卷积加速.Vivado里生成本代码所需Block Ram IP时要把Output R ...

  5. 【DB宝44】Oracle rac集群中的IP类型简介

    文章目录 Oracle rac集群中的IP类型简介 (一)Public IP (二)Private IP (三)Virtual IP(VIP) (四)SCAN IP (五)GNS VIP (六)HAI ...

  6. 服务器中的SAS硬盘简介

    服务器中的SAS硬盘简介 摘要:在Intel阵营的服务器产品中,"采用双核处理器,FBD内存(Fully Buffer DIMM,全缓冲内存),和SAS(串行SCSI)硬盘组合"形 ...

  7. linux mint 修改dns,如何在Ubuntu和LinuxMint中刷新DNS缓存

    本篇文章给大家介绍的内容是关于如何在Ubuntu和LinuxMint中刷新DNS缓存,下面我们来看具体的内容. 域名系统(DNS)是互联网的主干网之一.你无法想象在全球数百万用户的公共网络上运行网站. ...

  8. react中使用构建缓存_如何在React中构建热图

    react中使用构建缓存 Heat maps are a great way of visualizing correlations among two data sets.  With colors ...

  9. react中使用构建缓存_通过构建海滩度假胜地网站,了解如何使用React,Contentful和Netlify...

    react中使用构建缓存 In this full course from John Smilga you will learn React by building a beach resort we ...

最新文章

  1. 如何将全景分割用到养猪场?
  2. R语言生成对数线性间隔数据序列(Log-linearly Spaced Sequences)
  3. 2017/05/07 java 基础 随笔
  4. C语言 复制文件内容粘贴到另一个文件中
  5. 2019 深度学习框架大盘点!看 PyTorch、TensorFlow 如何强势上榜?
  6. 自动语音识别(ASR)自监督方法研究综述
  7. github上传本地代码
  8. vue项目安装less_部署vue项目、安装mongodb
  9. QT创建文件夹(QDir方式)
  10. Tips/Tricks#3:利用JavaScript选择GridView行
  11. 已root手机在DDMS下无法读取data目录的解决办法
  12. 代的划分是根据计算机的运算速度来划分,计算机的发展经历了四代,代的划分是根据计算机的运算速度来划分....
  13. centos 6.7 perl 版本 This is perl 5, version 22 安装DBI DBD
  14. 带你揭秘网络工程师群体!
  15. python列表查找元素用什么运算符_【Python】第012课,定义和使用列表,列表的运算符,列表元素的遍历i,列表的方法,元素位置和次数,元素排序和反转。...
  16. CSS 分析倒三角|侧三角|正三角的实现
  17. 华为鸿蒙2.0系统HarmonyOS 2.0安装谷 歌 商 店 G o o g l e P l a y
  18. ppt2016保存.html,PPT做完以后,按了保存就消失不见了,怎么找到原来的PPT?
  19. 电子商务数据分析,超详细宝典!
  20. 键盘侠Linux教程(一)| 初学者建议

热门文章

  1. react-webpack-express
  2. PyTorch 笔记(13)— autograd(0.4 之前和之后版本差异)、Tensor(张量)、Gradient(梯度)
  3. acitivity 和fragment 通信,使用广播来传递信息的问题
  4. 使用按钮控制HTML5背景音乐开关
  5. spark+openfire即时通讯工具二次开发参考文档
  6. 调试 后台 ajax post 对应的php的方法
  7. TensorFlow常用操作:代码示例
  8. java 对比两个表的字段的差异_Joolun小程序商城 2.2.2版本上线了——Java微信快速开发平台...
  9. python读取csv文件第一行_尝试读取CSV文件的第一行返回['/']
  10. 怎么读懂python语句_Python入门基础知识点总结,一点文章就能让你看懂Python