|
|
|
|
公众号矩阵

从虚拟内存看可执行文件的装载

当双击打开一个可执行文件的时候,计算机究竟干了什么?磁盘上的可执行文件是怎么装载到内存当中去的?对于众多程序猿来说,这也仍然是一个不太容易回答的问题。

作者:冷面不冷 来源:Linux澡堂子|2021-01-06 05:29

本文转载自微信公众号「Linux澡堂子」,作者冷面不冷 。转载本文请联系Linux澡堂子公众号。 

当双击打开一个可执行文件的时候,计算机究竟干了什么?磁盘上的可执行文件是怎么装载到内存当中去的?对于众多程序猿来说,这也仍然是一个不太容易回答的问题。

这次让我们从虚拟内存的角度来看看可执行文件的装载过程,仔细分析从可执行文件开始装载到第一条指令执行时发生了什么。

本文不再详细解释进程的概念、ELF文件结构、虚拟内存的定义、分页的概念、请求分页的工作原理,之前的文章讲过,感兴趣的小伙伴自行搜索。

装载大体上可以分为以下几步:

  1. 创建进程
  2. 创建虚拟地址空间
  3. 读取可执行文件头,建立虚拟地址空间与可执行文件的映射关系
  4. 设置CPU指令寄存器为可执行文件入口地址
  5. 执行,触发缺页中断

创建进程

创建进程不必多说了,此时会创建如进程标识符、进程优先级之类的信息。注意此时还不涉及到可执行文件。

创建虚拟地址空间

这一步其实应该算在创建进程里面,实际就是创建页表(多级页表),用来与物理内存建立连接,此时这个页表是空的。此时仍然不涉及到可执行文件。

读取可执行文件头

这个就是关键的一步了。进程开始读取可执行文件头,即ELF文件的头部,此时进程也仅仅读取ELF文件头部,不涉及到其他段。ELF文件头中含有可执行文件各段的起始地址和长度等信息,以及可执行文件入口地址,注意这里"地址"即虚拟内存地址。

这里需要强调的是:整个装载过程也仅仅是读取了ELF头部,仅此而已。因为ELF头部记录了整个可执行文件的节奏,所以根据ELF头部即可建立整个可执行文件的框架。因此,这一步是在建立与磁盘的连接。举个简单的例子,当发生缺页中断时,操作系统该去哪把缺的页加载到物理内存?这就是这一步的关键之处了。将虚拟内存地址与磁盘地址建立联系,当缺页时即可寻找到对应的磁盘地址,从而加载到物理内存。

还需要强调的一点是,此时在进程中,实际相当于是仅仅保存了一个函数映射关系。如下图有更直观的理解。

请记住这个图,后续我们讲到内存管理的时候再把进程和内存结合起来看,到时候你就会站在上帝视角对内核有了指点江山的感觉。

设置CPU指令寄存器

如上两步建立了虚拟地址空间和物理内存、磁盘的映射关系,现在就要准备运行此程序了。运行的第一条指令地址在哪?在ELF头部中。将CPU指令寄存器的值设置为第一条指令地址即可。

执行,触发缺页中断

想想CPU在从入口地址取指令时会发生什么。假设入口地址指向.text段首,如图所示为0x8049000;CPU以此虚拟地址查找页表发现该页尚未装载,触发缺页中断。此时操作系统接管,从之前建立的虚拟地址空间与磁盘的映射关系中找到此页在磁盘中的地址;再从此地址读取页,加载到物理内存,缺页中断完毕。CPU重新从入口地址取指令,此时由页表得到物理地址,从内存中得到对应的指令,交给CPU。

随着进程的执行,缺页中断不断出现,磁盘中的可执行文件也逐渐加载到内存中。

总结

如上便是简单的可执行文件的装载过程,最需要强调的一点是,可执行文件的数据是 按需 加载到物理内存的,缺页中断驱动着进程的执行。

【编辑推荐】

  1. Citrix Provisioning 1912新版本虚拟桌面部署
  2. VMware虚拟机(Linux)如何找出系统中磁盘设备对应的硬盘
  3. 4.1内存这个大话题--C语言部分精讲篇开篇部分
  4. Azure Linux 虚拟机之间通过 rsync 的文件传输
  5. LINUX虚拟化、Docker虚拟化及OPENSTACK云平台搭建视频课程(MK亲授)
【责任编辑:武晓燕 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

数据湖与数据仓库的分析实践攻略

数据湖与数据仓库的分析实践攻略

助力现代化数据管理:数据湖与数据仓库的分析实践攻略
共3章 | 创世达人

1人订阅学习

云原生架构实践

云原生架构实践

新技术引领移动互联网进入急速赛道
共3章 | KaliArch

30人订阅学习

数据中心和VPDN网络建设案例

数据中心和VPDN网络建设案例

漫画+案例
共20章 | 捷哥CCIE

207人订阅学习

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO官微