C/C++|malloc底层原理与内存分配详解
看本节前,希望读者有linux内存分布的基本概念,可以阅读这篇文章:
进程虚拟地址空间和函数调用栈
在本节中希望读者可以一口气阅读完所有内容。
本博客内容全部来自小林coding:malloc 是如何分配内存的?
这里仅为笔记记录。
文章目录
malloc是如何分配内存的?
首先我们要明确一点,malloc() 并不是系统调用,而是 C 库里的函数,用于动态分配内存。
同时调用mlloc也并不一定会陷入内核态。
malloc申请内存会以两种方式向操作系统申请堆内存:
- 通过 brk() 系统调用从堆分配内存
- 通过 mmap() 系统调用在文件映射区域分配内存
通过 brk() 系统调用
brk()的实现方式就是将「堆顶」指针向高地址移动,获得新的内存空间。
并且malloc()源码中默认定义了阈值,如果用户分配内存小于128KB则通过brk()申请内存。
通过mmap()申请内存
mmap() 系统调用通过「私有匿名映射」的方式,在文件映射区分配一块内存,也就是从文件映射区“偷”了一块内存。如下图:
在操作文件时,我们一般通过 open() 打开文件,然后使用 mmap() 将文件内容直接映射到虚拟内存上,这样我们就可以像操作内存一样操作文件的内容,这一块区域就是文件映射区。
如果用户分配的内存大于 128 KB,则通过 mmap() 申请内存;
不同的gilbc版本定义的阈值也是不同的
⭐️malloc()分配的是物理内存吗?
这个答案很明显,malloc分配的是虚拟内存,但是下一句话更加重要!
如果分配后的虚拟内存没有被访问的话,虚拟内存是不会映射到物理内存的,这样就不会占用物理内存了。
- 在访问已分配的虚拟地址空间的时候,操作系统通过查找页表,发现虚拟内存对应的页没有在物理内存中;
- 就会触发缺页中断,
- 然后操作系统会建立虚拟内存和物理内存之间的映射关系。
⭐️malloc()竟然会构建内存池!
malloc() 在分配内存的时候,会预分配更大的空间作为内存池。
也就是说,当我们调用brk()系统调用申请堆内存,仍然会为我们分配超过128KB字节的内存。即使你 malloc()的内存远小于128k也是一样。
为什么malloc要使用内存池来进行管理呢?
- 提高效率:内存池预先分配一大块内存,然后在需要时从中分配小块,减少了频繁调用系统级别的内存分配开销(brk()\mmap())「每次调用 sbrk 或 mmap 时,程序需要从用户态切换到内核态,这个切换过程本身就有一定的开销;陷入内核态也涉及到了系统需要更新内存管理的数据结构,如页表和内存分配表,需要额外的时间;再一个,为了保证内存分配的线程安全,内核需要处理同步和锁管理,增加了开销」。
现在你还觉得每次调用malloc都会陷入内核态吗?
- 减少了内存碎片,内存池通过组织和管理内存块,能更好地利用内存空间,减少内存碎片,提高内存使用率。
- 快速释放和重用,跟第一点一样,在池内管理,避免了系统调用的高开销。
free释放内存,会马上归还给操作系统吗?
看了malloc竟然开辟了内存池,你觉得free会把内存归还给操作系统吗?
这里直接说结论:
通过 free 释放内存后,堆内存还是存在的,并没有归还给操作系统。当然,当进程退出后,操作系统就会回收进程的所有资源。
但是!
如果我们使用mmap方式申请内存,free释放内存后就会马上归还操作系统。
总结:
- malloc 通过 brk() 方式申请的内存,free 释放内存的时候,并不会把内存归还给操作系统,而是缓存在 malloc 的内存池中,待下次使用;
- malloc 通过 mmap() 方式申请的内存,free 释放内存的时候,会把内存归还给操作系统,内存得到真正的释放。
即然 brk 那么好,为什么不全部使用brk来分配?
我们考虑这样一个场景:
如果我们连续申请了 10k,20k,30k 这三片内存,如果 10k 和 20k 这两片释放了,变为了空闲内存空间,如果下次申请的内存小于 30k,那么就可以重用这个空闲内存空间。
但是如果下次申请的内存大于 30k,没有可用的空闲内存空间,必须向 OS 申请,实际使用内存继续增大。
因此,随着系统频繁地 malloc 和 free ,尤其对于小块内存,堆内将产生越来越多不可用的碎片,导致“内存泄露”。而这种“泄露”现象使用 valgrind 是无法检测出来的。
所以,malloc 实现中,充分考虑了 brk 和 mmap 行为上的差异及优缺点,默认分配大块内存 (128KB) 才使用 mmap 分配内存空间。
更多推荐
所有评论(0)