malloc 源码_UE4源码剖析：MallocBinned（上）

最近开始做UE4项目了，仰慕UnrealEngine已久，但是没有机会深入了解。这次终于有机会了解一下，所以打算好好读一读UE4的源码。又因为现在项目内存性能捉急，所以我打算从内存分配器入手。看源码是懂得越多看到的越多，我个人水平有限，还不能完完全全了解透彻。主要是给一些新手朋友们揭开神秘的源码面纱，让源码不再神秘，面对源码不再犯怵。

UE4的内存分配器是划分在硬件抽象层，即HAL（Hardware Abstraction Layer）中的。装箱内存分配器的代码具体在VS项目目录：UE4/Source/Runtime/Core/Private/HAL/MallocBinned

我们先从ApplePlatformMemory::BaseAllocator开始，从这段代码可以看出来，Mac平台的默认分配器是MallocBinned，iOS的默认分配器是MallocAnsi，我们从MallocBinned开始看。先看FMallocBinned::Malloc，再看FMallocBinned::FMallocBinned。

一、确定对齐方式

FScopeLock是一个局部线程锁，当前线程离开大括号后，其他线程才能走进大括号。实际上是约定内存分配是线程同步的。

再看这段代码，首先确定下Alignment是个什么情况。我们全局搜一下，发现大家调用FMemory::Malloc的时候一般只传一个参数，Alignment使用默认的。我们看了头文件，发现没有定义Alignment的默认值，但是这个Malloc函数重载过。所以去FMallocBinned的父类FMalloc看看，可以发现Alignment的默认值是0。所以可以看出来这段代码的意思是，如果用户没有定义内存对齐，那么就使用默认的内存对齐Private::DEFAULTBINNEDALLOCATOR_ALIGNMENT。

这个默认对齐又是什么呢，我们跟过去看看。

这里我们可以看到，DEFAULT_BINNED_ALLOCATOR_ALIGNMENT就是FFreeMem的大小。（以下讨论只考虑32位寻址空间）sizeof(FFreeMem)的大小我们可以确定，一个指针的大小是4bytes，uint32是4bytes，所以sizeof(FFreeMem) = 8，所以默认的内存对齐是8字节。为什么是FFreeMem？我们看下FFreeMem的定义和注释就知道，FFreeMem包含了一片内存的基本信息，每片内存的头都是它，所以一片内存最小也是8字节。如果内存对齐设小了，连FFreeMem都放不下，更别说内容了。

最后我们把这段代码翻译一下就是：如果用户没有自定义内存对齐，就使用默认的8字节内存对齐，否则使用自定义内存对齐。

二、确定有足够空间来内存对齐

这段代码，前面两行就是确定有足够空间来内存对齐。后面三行是统计用的，略过。这里我们首先要确认下SpareBytesCount是个什么，它代表了什么含义。我们假设是32位寻址空间，那么DEFAULT_BINNED_ALLOCATOR_ALIGNMENT = 8，PoolTable[0].BlockSize = 8所以

Size <= 8，SpareBytesCount = Size
- Max(8, Size + (Alignment - Size)) = Max(8, Alignment) = Alignment
Size > 8，SpareBytesCount = 8
- Max(8, Size + (Alignment - 8))

所以这一段代码翻译一下：分配内存大小小于8字节，按Alignment大小来匹配箱体。如果分配内存大于8字节，按Size + Alignment再减去内存头（即sizeof(FFreeMem)）后的大小匹配箱体。真正Alloc的时候加上内存头，总大小Size + Alignment。为什么是这个大小呢，这个大小保证了最后Align的时候一定有足够的空间。

三、确定箱体大小

我们继续往下看代码，会发现根据Size的大小有三种不同的处理方式。我们从上到下，先看第一种情况。

我们首先确认下BinnedSizeLimit是多少，搜索“BinnedSizeLimit = ”可以发现，只有一处赋值。

其中PAGE_SIZE_LIMIT等于64k，BinnedSizeLimit为32k。所以内存分配大小为32k以下的，使用第一种方式分配（这里剧透一下，也就是装箱分配）。继续看下一行，用Size做索引，从PoolTable里取一个Table出来。那么问题来了，这个MemSizeToPoolTable是什么东西。我们稍微看一下上下文，可以发现MemSizeToPoolTable是在构造函数里初始化的。

从835行开始是MemSizeTpPoolTable的初始化，但是看这段代码前必须要理解一下PoolTable是个啥，所以我们先看看上面的代码。通过代码、注释、上下文，可以看出来PoolTable就是指32k以下的内存分为42个8字节、16字节、32字节、48字节等等大小的池子。PoolTable里面每个Table的BlockSize和MinRequest都是基本参数，疑问1：FirstPool和ExhaustedPool是干嘛用的呢，我们暂时还看不出来，带着疑问继续往下看。

知道了PoolTable的含义后，可以看出来下面这段代码意思其实是[0-8]使用第一个池子，即BlockSize为8；[9-16]使用第二个池子；[17-32]使用第三个池子；以此类推。由于MemSizeToPoolTable用的时候只会用小于32768的值来取值，所以32768和32769用来存PagePoolTable[0]、[1]。疑问2：PagePoolTable是什么呢？后面揭晓

所以总结一下，这些代码确定了箱体大小。MemSizeToPoolTable“人”如其名，就是通过Size的大小，来找到合适他的装箱内存池。至于为什么要这么麻烦还构造一个数组，应该是为了性能，这样这个查找的过程不会浪费性能。

四、初始化内存池

我们回到Malloc函数，继续往下看，现在我们取到了一个合适大小的Table，然后直接看899行，中间的代码都可以略过。

这段代码看命名可以猜测，应该是看有无FirstPool，没有的话分配一整个池子的内存，然后从内存里分配一个Block。而且这里用到了FirstPool，看来接下来能解开上面FirstPool的疑问。我们先看下AllocatePoolMemory的实现，再看看AllocateBlockFromPool的实现。

PageSize取的是Allocator.PageSize，这个值全局搜下可以发现如果物理PageSize小于64k，取64k，物理PageSize大小大于64k，取物理页大小。所以这个值一般是64k。

PoolSize是传进来的参数，Private::BINNED_ALLOC_POOL_SIZE，65536。这个值除以BlockSize，得到可以分的块数。Bytes等于这些块的内存大小，最后拿这个大小和物理页大小对齐一下。这里为什么不直接用PoolSize做对齐呢，因为有时候BlockSize会很大，这时候PoolSize - Bytes会很大，比如30k。这样用PoolSize对齐出来的OsBytes就会有30多k的浪费。总之，到348行，我们得到一个对齐后的合适的内存大小。350、351是一些断言检查，防止相关变量被魔改后产生的意外情况（这很重要:)）。

353-356真正地去分配了一块内存，其中Free指向这块内存地头。358-362又是做一些检查，接下来就是初始化Pool了。

这段代码364-369和内存分配没关系，370行是给定一个内存地址，获得内存池信息。371-378的循环，如果不魔改代码是进不来的，PageSize = 64k ≈ OsBytes，其中OsBytes略小。381-382是统计接口，不用管。如果魔改了进来了呢，是什么情况？有空再来写……

如果Table->FirstPool为nullptr，这个Link就是把FirstPool指向自己。如果Table->FirstPool不为空，则将自己作为FirstPool，并且PrevLink和Next都指向原FirstPool。回答1：FirstPool是什么？所以FirstPool是尚有空余Block的Pool组成的链表。

SetAllocationSizes是初始化内存池的基本信息，后面396-397初始化了第一个Block，396记录了下剩余可用Block，397设置下一个Block为nullptr。

总结一下，这个内存池初始化，主要工作只有2点。

分配了一块和物理PageSize对齐过的内存大小
初始化了内存池的第一个Block

五、内存装箱

AllocateBlockFromPool从内存池中分配一个Block，这就是真正内存装箱的过程（把一块略小的数据放在一个标准的”Block集装箱“中）。

首先Taken自增，将已分配的块数加一。后续四行都是断言，410行可以看出FirstMem指向Pool的头，而新分配的Block则在Pool的尾部。如图：

这里为什么从Pool的尾部开始分配，而不从头部分配呢？我猜测是因为如果从头部分配，需要记录剩余Block数，而计算新Block的指针地址的时候，需要知道已分配Block数。而从尾部分配，只记录剩余Block数就行。

如果这次分配是该Pool的最后一个Block，将该Pool从链表中断开，再链接到ExhaustedPool链表上。回答1：ExhaustedPool是什么？ExhaustedPool是一个链表，保存了该BlockSize的所有已满Pool。

最后执行一下对齐，返回Block的指针。

未完待续