理解pages和page Frames的区别
物理页面通常被称作Page Frames,而虚拟地址空间的页面通常被称为pages.Linux以page为单位管理内存。
并不是所有的虚拟地址空间pages都映射到了物理空间的page Frames.一方面,这些没有映射的pages要么是暂时还用不到,要么是由于不需要,数据还没有加载到内存里。另一方面, 这些没有映射的pages也可能是交换出(swapped out)到了硬盘里, 在被需要的时候才会换入(swap in)到虚存页面。Linux Swapping通过利用硬盘可以虚拟的扩大可用内存,不常用的内存页被swap out到硬盘上,并在页表中使用特殊标记的项标记,应用需要使用时则内核产生page fault将该页swap in 内存。内核会将暂时不用的内存块的内容写到硬盘上,这样一来,这块内存就可用于其它目的。当需要用到原始的内容时,它们被重新读入内存。这些操作对用户来说是完全透明的;Linux下运行的程序只是看到有大量的内存可供使用而并没有注意到时不时它们的一部分是驻留在硬盘上的。当然,读写硬盘要比直接使用真实内存慢得多(要慢数千倍),所以程序就不会象一直在内存中运行的那样快。用作虚拟内存的硬盘部分被称为交换空间(Swap Space)。一般,在交换空间中的页面首先被换入内存;如果此时没有足够的物理内存来容纳它们又将被交换出来(到其他的交换空间中)。如果没有足够的虚拟内存来容纳所有这些页面,Linux就会波动而不正常;但经过一段较长的时间Linux会恢复,但此时系统已不可用了.
物理内存不足时,会引起 swap 频繁读写,从而降低系统性能,因为与访问物理内存相比,磁盘的读写是很慢的。
数据结构page tables(页面)被用于虚拟地址空间和物理地址空间的映射。一种最简单的页表实现方式是:实现一个超级大数组,数组的索引是虚存空间的所有页面。这显然太浪费了, 因为大多数虚拟内存是空闲状态,没人在使用。正确的做法是只需要为正在使用或马上要使用的那部分虚拟内存创建页表即可。LINUX内核使用了“多层调页(multi-level paging)技术”来达到这一目的。这里的多级指的是;PGD(Page Global Directory,页总目录) + PMD(页中目录)+PTE(页表索引)+ OFFSET(页面内部偏移).
这种多层调页技术除了有上述优势外, 也带来了以下缺点:每次访问虚拟内存,都需要顺着这个链走一遍即多层查找才能获得对应的物理地址。为此,CPU的设计以以下两种方式来加速这个查找过程:
(1)通过内存管理单元MMU,优化取址和引用操作。
(2)地址翻译过程中最频繁用到的那些页表存储在CPU的一个叫TLB(翻译后备缓冲器)的cache里,能够有效减少寻找物理地址所消耗时间。TLB是一个小的,虚拟寻址的缓存,其中每一行都保存着一个由单个PTE(Page Table Entry,页表项)组成的块。如果没有TLB,则每次取数据都需要两次访问内存,即查页表获得物理地址和取数据。当CPU执行机构收到应用程序发来的虚拟地址后,首先到TLB中查找相应的页表数据,如果TLB中正好存放着所需的页表,则称为TLB命中(TLB Hit),接下来CPU再依次看TLB中页表所对应的物理内存地址中的数据是不是已经在一级、二级缓存里了,若没有则到内存中取相应地址所存放的数据。既然说TLB是内存里存放的页表的缓存,那么它里边存放的数据实际上和内存页表区的数据是一致的,在内存的页表区里,每一条记录虚拟页面和物理页框对应关系的记录称之为一个页表条目(Entry),同样地,在TLB里边也缓存了同样大小的页表条目(Entry)。
更多推荐
所有评论(0)