程序及指令的关系

CPU、程序与指令的关系

程序与指令的关系

程序由一条一条指令组成，指令按顺序存放在内存连续单元。
程序的执行：周而复始地执行一条一条指令

正常情况下，指令按其存放顺序执行。

遇到需要改变程序执行流程时，用相应的转移指令来改变程序执行流程。
程序的执行流的控制

将要执行的指令所在存储单元的地址由程序计数器PC给出，通过改变PC的值来控制执行顺序。
指令周期：CPU取出并执行一条指令的时间。（CPI：CPI(Cycle Per instruction):每条指令执行时所花费的平均时钟周期数）

CPU如何区分读出的代码是指令还是数据

简单点说，从指令周期的不同时期来判断！
取指周期取的是指令，在执行的时候取操作数取的是数据！

详细分析如下：

计算机可以从时间和空间两方面来区分指令和数据，在时间上，取指周期从内存中取出的是指令，而执行周期从内存取出或往内存中写入的是数据，在空间上，从内存中取出指令送控制器，而执行周期从内存从取的数据送运算器、往内存写入的数据也是来自于运算器。

比如：要计算机做1+2＝？中，“+”表示要做什么和怎样做，1和2则是做的时候需要的原始数。现在假设某CPU中，“+”用二进制“00000001”来表示，“1、2”分别用“00000001、00000010”来表示。那么，这段程序存入内存中就是这样的：
XXXX1:00000001
XXXX2:00000001
XXXX3:00000010 前面的XXXX1 XXXX2
XXXX3表示内存的地址
从上面可以看出，“+”指令和被加数是完全相同的，当然，这是我故意这样假设的，但是，在实际情况中，这种情况是大量存在的。在正常情况下，CPU只能把XXXX1内存中的00000001作为指令，XXXX2内存中的00000001作为被加数才能得到正确的结果。那么CPU如何才能做到不把第二个00000001也当成“+”呢？
1.人们把内存的某个地址规定为起始地址（又称为复位地址），也就是说，当计算机开机或者被强行复位（也就是机箱上那个重启动按钮按下的的时候），CPU立即跳转到这个地址中，并且把它里面的代码作为指令来执行，同时根据这个指令的长度和格式判断下一条指令在什么地方。
对于X86系列CPU（也就是现在人们常用的什么奔XX、赛XX系列），它的复位地址是FFFF0,如果表示成逻辑地址则是：FFFF:0000。对DEBUG比较熟悉的朋友或者会在一些高级语言中嵌入汇编语言的朋友可以这样做一个试验：
用DEBUG执行一条指令（这是一条无条件跳转指令）：jmp
FFFF:0000,或者在高级语言中嵌入这条汇编指令，执行后，你就会发现，计算机重新启动了(纯32位windows是不能进入实模式的，重启以后到载入WINDOWS以前都是实模式,只有实模式才能重启)。其实，用程序控制计算机重启的最本质的操作就是这样的。
2.给各种指令规定了相应的长度和格式。比如：某数+某数这条指令就规定：这条指令的长度是3个字节，其中第一个字节表示“+”，后面两个字节表示被加数和加数。于是，当CPU到达这个指令后，就自动把第一个代码作为指令，后面两个代码作为数据，依次类推，第4个代码就必然是指令

CS(CodeString)指向的是指令段地址，指令段寄存器
DS(DataString)指向的是数据段地址，数据段寄存器
SS(StackString)指向的是栈顶段地址，栈段寄存器

CS指向的段地址里，存的是指令
DS指向的段地址里，存的是数据

数据和程序在内存中都是已2进制的数据存贮，只有当2进制的数据被CS：IP指向时，才成为可执行的指令或程序。CPU要执行CS中的指令指令用到的数据可能就存放在DS中,你可以把数据放到CS 但是CPU并不把它当成数据来使用，你也可以把指令放到DS中，但是CPU根本不去DS里读指令。[^1 ]

CPU执行程序程序的原理

相关术语

RAM：指内存，断电后内容无法保存，因此叫做易失性存储；另一个相关的概念是ROM，一般指外存，例如硬盘。RAM的速度远快于ROM，CPU与内存直接进行数据交换。

CPU：计算机的所有计算操作都由它执行，只要先记住它是一块有输入和输出的集成电路就行了。

Instruction：指令，是CPU进行操作的基本单元，大致包含操作对象、操作对象的地址、对操作对象进行何种操作。
RAM的相关结构

程序要想被CPU执行，首先要被编译成CPU可以执行的指令操作，这里就不详细介绍，本文就假设程序已经被编译好了，放在了内存中。内存中存放的数据分为两类，一类是指令；另一类是数据，不管是指令还是数据都有其对应的地址。

内存的结构如下：

在上图中，现在已经存放了地址为100、104、108、112的一系列指令；地址为2000、2004、2008的一系列数据。
CPU相关结构

这里涉及到的结构有Program Counter（程序计数器）、Instruction Register（指令寄存器）、Data Register（数据寄存器）、ALU（算数逻辑单元），可以将计数器、寄存器都可以简单理解为存放数据的器件。上述程序计数器用来存放指令的地址；指令寄存器用来存放指令（初学者可能会搞混数据和地址的区别，稍加区分就可以分辨）；数据寄存器存放参与计算的数据，下图中的A、B、C都是数据寄存器；ALU就是用于计算的器件。
执行过程

本文内容为便于理解，仅涉及到CPU和内存间的数据交换。

在了解了RAM和CPU相关结构之后，接下来就可以正式开始说明执行的过程，其实就是对以上叙述内容的一个组合。
1. 程序计数器初始内容为100，指向内存中的某一项指令，注意100指的是地址；
2. 指令寄存器根据程序计算器的指向地址，将内存中地址为100的指令抓取到自身，此时存放LOAD A，2000；
3. CPU按照指令内容，将内存地址为2000的数据，上载到数据寄存器A中，此时CPU和RAM的状态如下图所示；
1. 以上3步已完成一个指令的基本操作步骤。接下来程序计数器依次指向104指令地址、108指令地址、112指令地址，分别完成将2004地址的数据赋值给B数据寄存器；ALU将A、B内的数据相乘赋值给C数据寄存器；将C数据寄存器数据写入内容地址2008中。
2. 这样就完成了50×0.1这个简单程序的计算，最后CPU和RAM所处状态如下图所示。

一条指令在CPU中执行的过程

程序及指令的关系

过程详细解释

几乎所有的冯·诺伊曼型计算机的CPU，其工作都可以分为5个阶段：取指令、指令译码、执行指令、访存取数、结果写回。

1．取指令阶段

取指令（Instruction Fetch，IF）阶段是将一条指令从主存中取到指令寄存器的过程。

程序计数器PC中的数值，用来指示当前指令在主存中的位置。当一条指令被取出后，PC中的数值将根据指令字长度而自动递增：若为单字长指令，则(PC)+1àPC；若为双字长指令，则(PC)+2àPC，依此类推。

2．指令译码阶段

取出指令后，计算机立即进入指令译码（Instruction Decode，ID）阶段。

在指令译码阶段，指令译码器按照预定的指令格式，对取回的指令进行拆分和解释，识别区分出不同的指令类别以及各种获取操作数的方法。

3．执行指令阶段

在取指令和指令译码阶段之后，接着进入执行指令（Execute，EX）阶段。

此阶段的任务是完成指令所规定的各种操作，具体实现指令的功能。为此，CPU的不同部分被连接起来，以执行所需的操作。

例如，如果要求完成一个加法运算，算术逻辑单元ALU将被连接到一组输入和一组输出，输入端提供需要相加的数值，输出端将含有最后的运算结果。

4．访存取数阶段

根据指令需要，有可能要访问主存，读取操作数，这样就进入了访存取数（Memory，MEM）阶段。

此阶段的任务是：根据指令地址码，得到操作数在主存中的地址，并从主存中读取该操作数用于运算。

5．结果写回阶段

作为最后一个阶段，结果写回（Writeback，WB）阶段把执行指令阶段的运行结果数据“写回”到某种存储形式：结果数据经常被写到CPU的内部寄存器中，以便被后续的指令快速地存取；在有些情况下，结果数据也可被写入相对较慢、但较廉价且容量较大的主存。许多指令还会改变程序状态字寄存器中标志位的状态，这些标志位标识着不同的操作结果，可被用来影响程序的动作。

在指令执行完毕、结果数据写回之后，若无意外事件（如结果溢出等）发生，计算机就接着从程序计数器PC中取得下一条指令地址，开始新一轮的循环，下一个指令周期将顺序取出下一条指令。

许多新型CPU可以同时取出、译码和执行多条指令，体现并行处理的特性。

参考资料

[^1 ] CPU如何区分读出的代码是指令还是数据

[^2 ] CPU的运行和内存的介绍

[^3 ] 32位系统最大只能支持4GB内存原因

[^4 ] CPU执行程序的原理