技术编程,linux系统|为什么 Linux 需要虚拟内存( 二 )
当用户程序访问未被缓存的虚拟页时 , 硬件就会触发缺页中断(Page Fault , PF) , 在部分情况下 , 被访问的页面已经加载到了物理内存中 , 但是用户程序的页表(Page Table)并不存在该对应关系 , 这时我们只需要在页表中建立虚拟内存到物理内存的关系;在其他情况下 , 操作系统需要将磁盘上未被缓存的虚拟页加载到物理内存中[^4] 。
文章图片
文章图片
page-fault
图 4 - 虚拟内存的缺页中断
因为主内存的空间是有限的 , 当主内存中不包含可以使用的空间时 , 操作系统会从选择合适的物理内存页驱逐回磁盘 , 为新的内存页让出位置 , 选择待驱逐页的过程在操作系统中叫做页面替换(Page Replacement) 。缺页中断和页面替换技术都是操作系统调页算法(Paging)的一部分 , 该算法的目的就是充分利用内存资源作为磁盘的缓存以提高程序的运行效率 。
内存管理
虚拟内存可以为正在运行的进程提供独立的内存空间 , 制造一种每个进程的内存都是独立的假象 , 在 64 位的操作系统上 , 每个进程都会拥有 256 TiB 的内存空间 , 内核空间和用户空间分别占 128 TiB[^5] , 部分操作系统使用 57 位虚拟地址以提供 128 PiB 的寻址空间[^6] 。因为每个进程的虚拟内存空间是完全独立的 , 所以它们都可以完整的使用 0x0000000000000000 到 0x00007FFFFFFFFFFFF 的全部内存 。
文章图片
文章图片
virtual-memory-space
图 5 - 操作系统的虚拟内存空间
虚拟内存空间只是操作系统中的逻辑结构 , 就像我们上面说的 , 应用程序最终还是需要访问物理内存或者磁盘上的内容 。因为操作系统加了一个虚拟内存的中间层 , 所以我们也需要为进程实现地址翻译器 , 实现从虚拟地址到物理地址的转换 , 页表是虚拟内存系统中的重要数据结构 , 每一个进程的页表中都存储了从虚拟内存到物理内存页的映射关系 , 为了存储 64 位操作系统中 128 TiB 虚拟内存的映射数据 , Linux 在 2.6.10 中引入了四层的页表辅助虚拟地址的转换[^7] , 在 4.11 中引入了五层的页表结构[^8] , 在未来还可能会引入更多层的页表结构以支持 64 位的虚拟地址 。
文章图片
文章图片
four-level-page-tables
图 6 - 四层页表结构
在如上图所示的四层页表结构中 , 操作系统会使用最低的 12 位作为页面的偏移量 , 剩下的 32 位会分四组分别表示当前层级在上一层中的索引 , 所有的虚拟地址都可以用上述的多层页表查找到对应的物理地址 。
因为有多层的页表结构可以用来转换虚拟地址 , 所以多个进程可以通过虚拟内存共享物理内存 。我们在 为什么 Redis 快照使用子进程 一文中介绍的写时复制就利用了虚拟内存的这个特性 , 当我们在 Linux 中调用 fork 创建子进程时 , 实际上 只复制了父进程的页表 。如下图所示 , 父子进程会通过不同的页表指向相同的物理内存:
文章图片
文章图片
process-shared-memory
图 7 - 进程间共享内存
虚拟内存不仅可以在 fork 时用于共享进程的物理内存 , 提供写时复制的机制 , 还能共享一些常见的动态库减少物理内存的占用 , 所有的进程都可能调用相同的操作系统内核代码 , 而 C 语言程序也会调用相同的标准库 。
推荐阅读
- 电池技术,相机发烧|防爆相机多少钱能买到?
- 行业互联网|深圳第22届高交会闭幕:一大批新技术新成果集中亮相
- 电池技术|动能转换看烟台|有锂电池的地方就有创为
- 行业互联网|2020十大新兴技术揭晓!每一项都可能颠覆我们的生活
- 行业互联网|英国运输技术论坛发布网络安全标准和指南摘要
- 钉科技|“选择性过滤”太难?方太“死磕”8年突破净水技术
- 中国新闻网|告别各自为营,梧桐车联宣布开放系统“技术底座”
- 腾讯|腾讯举办科学脱口秀X-Talk,聚焦人工智能、基因编辑等前沿技术
- |「推仔说新闻」NVIDIA曝光CPU+GPU加速技术 支持两家处理器
- 产业|清华教授魏少军:信息技术产业是全球GDP增长的主要动力
