pe文件,即portable executable文件,是windows操作系统上常见的可执行文件格式,包括exe、dll、ocx、sys和com等。pe文件可以在任何运行Windows的cpu体系结构上执行,因为它使用平面地址空间,将所有代码和数据合并成一个大型结构。文件内容被划分为不同的区块,每个区块在内存中具有不同的权限,如只读、只写或可执行。常见的区块包括:
- .text:编译或汇编后生成的指令代码区块。
- .rdata:运行时的只读数据区块,包含const常量。
- .data:初始化的数据区块,包含全局变量。
- .idata:包含其他DLL的函数和数据信息,即输入表。
- .rsrc:包含所有资源,如图标、菜单和位图等。
每个区块在内存中按页边界对齐,区块没有大小限制,是一个连续的结构,每个区块都有对应的属性。
PE文件的优势在于其在磁盘上的数据结构与在内存中的结构一致。以下是一些相关名词:
- 入口点(EntryPoint):程序执行的第一条指令所在的内存地址。
- 文件偏移地址(FileOffset):PE文件存储在磁盘上的时候,各个数据的地址相对于文件头的距离。
- 虚拟地址(VirtualAddress VA):应用程序访问的逻辑地址,即其虚拟地址。
- 基地址(ImageBase):文件被映射到内存时的初始地址。
PE文件的基本结构如下图所示:
在讨论PE文件时,常涉及以下几个名词:
- 基地址(ImageBase):PE文件被加载到内存中的首地址,是这个模块的句柄,可以使用函数GetModuleHandle来获取。
- 文件的偏移地址:PE文件中各个部分相对于文件头的偏移。
- 相对虚拟地址(RVA):PE结构被映射到内存中后,某个位置所在内存相对于基地址的偏移。
一般可执行文件被PE加载器加载到内存中后,文件的基本格式不会发生改变,只是会将各个块按照页来进行对齐。PE文件在磁盘与在内存中的对应关系大致如下图所示: