C语言内存分区模型

1.运行之前

我们想要执行编写的一段C程序，第一步需要对这个程序进行编译。

1）预处理：宏定义展开、头文件展开、条件编译，这里不会检查语法

2）编译：检查语法，将预处理后文件编译生成汇编文件

3）汇编：将汇编文件生成目标文件（二进制文件）

4）链接：将目标文件链接为可执行程序

当编译完成生成可执行文件后，（此时程序未加载到内存），可执行程序内部已经分好3段信息，分别为代码区（text）、数据区（data）和未初始化数据区（bss） (有些人把data和bss合起来叫做静态区或全局区)

C语言内存分区模型

只读的

数据区：1.全局初始化数据区/静态数据区（data段）：初始化的全局变量（extent）和静态变量（static）和常量数据（const 字符串常量） 2.未初始化数据区（bss区）：未初始化的全局变量（extent）和静态变量（static）和常量数据（const 字符串常量）。未初始化数据区的数据在程序开始执行之前被内核初始化为0或者NULL

总结：程序源代码被编译之后主要分成两种区：程序指令段（代码区）和程序数据段（数据区）。

程序在加载到内存之前，代码区和全局区（data+bss）大小是固定的，操作系统把物理硬盘程序加载到内存后，除了根据可执行程序的信息分出代码区（text）、数据区（data）和未初始化数据区（bss）之外，还额外增加了栈区、堆区

代码区（text segment）:加载的是可执行文件代码段，所有的可执行代码都加载到代码区，这块内存是不可以修改的

全局初始化数据区/静态数据区（data segment）:加载的是可执行文件数据段，存储全局初始化、静态初始化、常量等数据，存储数据的生存周期为整个程序运行过程

未初始化的数据区（BSS）：加载的是可执行文件BSS端，位置可以分开或紧靠数据段，存储全局未初始化，静态未初始化的数据，存储数据的生存周期为整个程序的运行过程

栈区（stack）:栈一种先进后出的数据结构，由编译器自动分配释放，存储参数的参数值、返回值、局部变量等。在程序运行过程中实时加载和释放。因此局部变量的生存周期为申请到释放该段栈空间

堆区（heap）：堆是一个大容器，它的容量要远远大于栈，没有栈先进后出的顺序。用于动态分配。堆在内存中位于BSS和栈区之间。一般由程序员分配和释放，若程序员不释放，程序结束由操作系统回收。

C语言内存分区模型

该图从下往上依次是text段 data段 bss段堆栈，而且很容易看出栈的生长方向为从高地址到低地址，堆的生长方向为低地址到高地址

Linux下32位环境的用户空间内存分布状况

C语言内存分区模型

代码区：存放程序编译后的二进制代码，不可寻址区

数据区包括：堆，栈，全局/静态存储区

全局/静态存储区包括：全局区（extent），静态区(static)，常量区(const)

常量区包括：字符串常量、常变量（const）

c/c++的内存分区其实只有两个，代码区和数据区