从虚拟内存看可执行文件的装载

云计算 虚拟化
当双击打开一个可执行文件的时候,计算机究竟干了什么?磁盘上的可执行文件是怎么装载到内存当中去的?对于众多程序猿来说,这也仍然是一个不太容易回答的问题。

[[373936]]

本文转载自微信公众号「Linux澡堂子」,作者冷面不冷 。转载本文请联系Linux澡堂子公众号。  

当双击打开一个可执行文件的时候,计算机究竟干了什么?磁盘上的可执行文件是怎么装载到内存当中去的?对于众多程序猿来说,这也仍然是一个不太容易回答的问题。

这次让我们从虚拟内存的角度来看看可执行文件的装载过程,仔细分析从可执行文件开始装载到第一条指令执行时发生了什么。

本文不再详细解释进程的概念、ELF文件结构、虚拟内存的定义、分页的概念、请求分页的工作原理,之前的文章讲过,感兴趣的小伙伴自行搜索。

装载大体上可以分为以下几步:

  1. 创建进程
  2. 创建虚拟地址空间
  3. 读取可执行文件头,建立虚拟地址空间与可执行文件的映射关系
  4. 设置CPU指令寄存器为可执行文件入口地址
  5. 执行,触发缺页中断

创建进程

创建进程不必多说了,此时会创建如进程标识符、进程优先级之类的信息。注意此时还不涉及到可执行文件。

创建虚拟地址空间

这一步其实应该算在创建进程里面,实际就是创建页表(多级页表),用来与物理内存建立连接,此时这个页表是空的。此时仍然不涉及到可执行文件。

读取可执行文件头

这个就是关键的一步了。进程开始读取可执行文件头,即ELF文件的头部,此时进程也仅仅读取ELF文件头部,不涉及到其他段。ELF文件头中含有可执行文件各段的起始地址和长度等信息,以及可执行文件入口地址,注意这里"地址"即虚拟内存地址。

这里需要强调的是:整个装载过程也仅仅是读取了ELF头部,仅此而已。因为ELF头部记录了整个可执行文件的节奏,所以根据ELF头部即可建立整个可执行文件的框架。因此,这一步是在建立与磁盘的连接。举个简单的例子,当发生缺页中断时,操作系统该去哪把缺的页加载到物理内存?这就是这一步的关键之处了。将虚拟内存地址与磁盘地址建立联系,当缺页时即可寻找到对应的磁盘地址,从而加载到物理内存。

还需要强调的一点是,此时在进程中,实际相当于是仅仅保存了一个函数映射关系。如下图有更直观的理解。

请记住这个图,后续我们讲到内存管理的时候再把进程和内存结合起来看,到时候你就会站在上帝视角对内核有了指点江山的感觉。

设置CPU指令寄存器

如上两步建立了虚拟地址空间和物理内存、磁盘的映射关系,现在就要准备运行此程序了。运行的第一条指令地址在哪?在ELF头部中。将CPU指令寄存器的值设置为第一条指令地址即可。

执行,触发缺页中断

想想CPU在从入口地址取指令时会发生什么。假设入口地址指向.text段首,如图所示为0x8049000;CPU以此虚拟地址查找页表发现该页尚未装载,触发缺页中断。此时操作系统接管,从之前建立的虚拟地址空间与磁盘的映射关系中找到此页在磁盘中的地址;再从此地址读取页,加载到物理内存,缺页中断完毕。CPU重新从入口地址取指令,此时由页表得到物理地址,从内存中得到对应的指令,交给CPU。

随着进程的执行,缺页中断不断出现,磁盘中的可执行文件也逐渐加载到内存中。

总结

如上便是简单的可执行文件的装载过程,最需要强调的一点是,可执行文件的数据是 按需 加载到物理内存的,缺页中断驱动着进程的执行。

 

责任编辑:武晓燕 来源: Linux澡堂子
相关推荐

2017-02-07 10:22:53

2023-03-31 23:31:06

.go文本文件

2015-02-02 11:03:12

2012-01-05 10:37:40

Java

2010-02-22 18:04:27

CentOS mpla

2022-05-11 14:50:34

Python解包执行文件

2021-01-08 08:06:19

脚本Shell文件

2021-01-12 10:10:41

shell脚本Linux命令

2011-08-09 10:24:19

可执行文件病毒病毒

2009-06-20 09:21:37

UNIXLINUX

2009-04-16 10:37:17

Javaexejar

2023-09-04 07:14:36

2023-12-18 09:21:22

开发静态编译Linux

2023-12-25 16:10:34

Linuxdconfig命令

2022-05-20 08:55:02

py文件exepython

2021-01-14 22:17:09

PythonLinux工具

2022-03-07 07:57:04

Linux工具内存

2021-04-19 10:26:41

网络安全PE文件

2021-07-02 05:23:10

微软Edge浏览器

2020-06-08 08:38:24

可执行文件文件字符
点赞
收藏

51CTO技术栈公众号