1.运行之前
我们想要执行编写的一段C程序,第一步需要对这个程序进行编译。
1)预处理:宏定义展开、头文件展开、条件编译,这里不会检查语法
2)编译:检查语法,将预处理后文件编译生成汇编文件
3)汇编:将汇编文件生成目标文件(二进制文件)
4)链接:将目标文件链接为可执行程序
当编译完成生成可执行文件后,(此时程序未加载到内存),可执行程序内部已经分好3段信息,分别为代码区(text)、数据区(data)和未初始化数据区(bss) (有些人把data和bss合起来叫做静态区或全局区)
- 代码区:共享的
只读的
- 数据区:1.全局初始化数据区/静态数据区(data段):初始化的全局变量(extent)和静态变量(static)和常量数据(const 字符串常量) 2.未初始化数据区(bss区):未初始化的全局变量(extent)和静态变量(static)和常量数据(const 字符串常量)。未初始化数据区的数据在程序开始执行之前被内核初始化为0或者NULL
总结:程序源代码被编译之后主要分成两种区:程序指令段(代码区)和程序数据段(数据区)。
2.运行之后
程序在加载到内存之前,代码区和全局区(data+bss)大小是固定的,操作系统把物理硬盘程序加载到内存后,除了根据可执行程序的信息分出代码区(text)、数据区(data)和未初始化数据区(bss)之外,还额外增加了栈区、堆区
代码区(text segment):加载的是可执行文件代码段,所有的可执行代码都加载到代码区,这块内存是不可以修改的
全局初始化数据区/静态数据区(data segment):加载的是可执行文件数据段,存储全局初始化、静态初始化、常量等数据,存储数据的生存周期为整个程序运行过程
未初始化的数据区(BSS):加载的是可执行文件BSS端,位置可以分开或紧靠数据段,存储全局未初始化,静态未初始化的数据,存储数据的生存周期为整个程序的运行过程
栈区(stack):栈一种先进后出的数据结构,由编译器自动分配释放,存储参数的参数值、返回值、局部变量等。在程序运行过程中实时加载和释放。因此局部变量的生存周期为申请到释放该段栈空间
堆区(heap):堆是一个大容器,它的容量要远远大于栈,没有栈先进后出的顺序。用于动态分配。堆在内存中位于BSS和栈区之间。一般由程序员分配和释放,若程序员不释放,程序结束由操作系统回收。
该图从下往上依次是text段 data段 bss段 堆 栈,而且很容易看出栈的生长方向为从高地址到低地址,堆的生长方向为低地址到高地址
Linux下32位环境的用户空间内存分布状况
|
类型 |
作用域 |
生命周期 |
存储位置 |
|
static局部变量 |
一对{}内 |
整个程序运行期 |
初始化在data段,未初始化在BSS段 |
|
extern变量 |
整个程序 |
整个程序运行期 |
初始化在data段,未初始化在BSS段 |
|
static全局变量 |
当前文件 |
整个程序运行期 |
初始化在data段,未初始化在BSS段 |
|
extern函数 |
整个程序 |
整个程序运行期 |
代码区 |
|
static函数 |
当前文件 |
整个程序运行期 |
代码区 |
|
字符串常量 |
当前文件 |
整个程序运行期 |
data段 |
3.易混淆概念
代码区:存放程序编译后的二进制代码,不可寻址区
数据区包括:堆,栈,全局/静态存储区
全局/静态存储区包括:全局区(extent),静态区(static),常量区(const)
常量区包括:字符串常量、常变量(const)
4.结论
c/c++的内存分区其实只有两个,代码区和数据区