汇编语言个人学习笔记——第八章数据处理的两个问题

引言：

本章对前面的所有nei'内容是具有总结性的。我们知道，计算机时进行数据处理、运算的机器，那么有两个基本的问题就包含在其中：

（1）处理的数据在什么地方？

（2）要处理的数据有多长？

这两个问题，在机器指令中必须给以明确或隐含的说明，否则计算机就无法工作。

本章的学习将针对8086CPU对这两个基本问题进行讨论。虽然讨论是在8086CPU的基础上进行的，但是这两个基本问题确实普遍的，对任何一个处理器都存在的。

在以后的学习中，我们将使用两个描述性符号reg（寄存器的缩写）来表示一个寄存器，用sreg（段寄存器的缩写）表示一个段寄存器。

reg的集合包括：ax、bx、cx、dx、ah、al、bh、bl、ch、cl、dh、dl、sp、bp、si、di；

sreg的集合包括：ds、ss、cs、es。

8.1 bx、si、di、bp

前面三个寄存器已经有过接触，总结一下：

（1）在8086CPU中，只有这4个寄存器（bx、bp、si、di）可以用在“[……]”中来进行内存单元的寻址。

正确的指令：错误的指令：

mov ax,[bx] mov ax,[cx]

mov ax,[bx+si] mov ax,[ax]

mov ax,[bx+di] mov ax,[dx]

mov ax,[bp] mov ax,[ds]

mov ax,[bp+si] mov ax,[bx+ax]

mov ax,[bp+di]

（2）在“[……]”中，这四个寄存器（bx、bp、si、di）可以单个出现，或只能以四种组合出现：

bx和si、bx和di、bp和si、bp和di。

错误的用法：

mov ax,[bx+bp]

mov ax,[si+di]

正确的用法：

mov ax,[bx] mov ax,[bp+si]

mov ax,[si] mov ax,[bp+di]

mov ax,[di] mov ax,[bx+si+idata]

mov ax,[bp] mov ax,[bx+di+idata]

mov ax,[bx+si] mov ax,[bp+si+idata]

mov ax,[bx+di] mov ax,[bp+di+idata]

（3）只要在[……]中使用寄存器bp，而指令中没有显性的给出段地址，段地址就默认在ss中。比如：

mov ax,[bp] 含义：(ax)=((ss)*16+(bp))

mov ax,[bp+idata] 含义：(ax)=((ss)*16+(bp)+idata)

mov ax,[bp+si] 含义：(ax)=((ss)*16+(bp)+(si))

mov ax,[bp+si+idata] 含义：(ax)=((ss)*16+(bp)+(si)+idata)

8.2机器指令处理的数据所在位置

绝大部分机器指令都是进行数据处理的指令，处理大致可分为三类：

读取、写入、运算

在机器指令这一层来讲，并不关心数据的值是多少，而关心指令执行前一刻，他将要处理的数据所在的位置。

指令在执行前，所要处理的数据可以在三个地方：

CPU内部、内存、端口

举例：

汇编语言个人学习笔记——第八章数据处理的两个问题

汇编语言中用三个概念来表达数据的位置。

1、立即数（idata）

2、寄存器

3、段地址（SA）和偏移地址（EA）

1、立即数

对于直接包含在机器指令中的数据（执行前在CPU的指令缓冲器中），在汇编语言中称为立即数（idata），在汇编指令中直接给出，例如：

mov ax,1

对应机器码：B80100

2、寄存器

指令要处理的数据在寄存器中，在汇编指令中给出相应的寄存器名。例如：

mov ax,bx

对应机器码：89D8

执行结果：（ax）=（bx）

3、段地址（SA）和偏移地址（EA）

指令要处理的数据在内存中，在汇编指令中可用[X]的格式给出EA，SA在某个段寄存器中。

存放段地址的寄存器可以是默认的。

示例：

mov ax,[bx]

mov ax,[bx+8]

mov ax,[bx+si]

mov ax,[bx+si+8]

段地址默认在ds中

mov ax,[bp]

mov ax,[bp+8]

mov ax,[bp+si]

mov ax,[bp+si+8]

段地址默认在ss中

存放段地址的寄存器也可以显性的给出。

示例：

mov ax,ds:[bp] 含义：(ax)=((ds)*16+(bp))

mov ax,es:[bx] 含义：(ax)=((es)*16+(bx))

mov ax,ss:[bx+si] 含义：(ax)=((ss)*16+(bx)+(si)）

mov ax,cs:[bx+si+8] 含义：(ax)=((cs)*16+(bx)+(si)+8)

8.4寻址方式

当数据存放在内存中的时候，可以用多种方式来给定这个内存单元的偏移地址，这种定位内存单元的方法一般被称为寻址方式。

8086CPU有多种寻址方式，在之前的学习中已经用到了，这里总结下：

汇编语言个人学习笔记——第八章数据处理的两个问题

8.5指令要处理的数据有多长？

8086CPU的指令，可以处理两种尺寸的数据，byte和word。所以在机器指令中要指明，指令进行的是字操作还是字节操作。

对于这个问题，汇编语言中用以下方法处理。

（1）通过寄存器名指明要处理的数据的尺寸。

下面的指令中，寄存器指寄存器指明了指令进行的是字操作：

mov ax,1

mov bx,ds:[0]

mov ds,ax

mov ds:[0],ax

inc ax

add ax,1000

下面的指令中，寄存器指明了指令进行的是字节操作：

mov al,1

mov al,bl

mov al,ds:[0]

mov ds:[0],al

inc al

add al,100

（2）在没有寄存器名的情况下，用操作符X ptr指明内存单元的长度，X在汇编指令中可以为word或byte。

下面的指令中，用word ptr指明了指令访问的内存单元是一个字单元：

mov word ptr ds:[0],1

inc word ptr [bx]

inc word ptr ds:[0]

add word ptr [bx],2

下面的指令中，用byte ptr指明了指令访问的内存单元是一个字节单元:

mov byte ptr ds:[0],1

inc byte ptr [bx]

inc byte ptr ds:[0]

add byte ptr [bx],2

在没有寄存器参与的内存单元访问指令中，用word ptr或byte ptr显性地指明所要访问的内存单元的长度是很有必要的。

否则，CPU无法得知所要访问的单元是字单元，还是字节单元。

假设我们用Debug查看内存的结果如下：

2000:1000 FF FF FF FF FF FF……

那么指令：

mov ax,2000H

mov ds,ax

mov byte ptr [1000H],1

将使内存中的内容变为：

2000:1000 01 FF FF FF FF FF……

而指令：

mov ax,2000H

mov ds,ax

mov word ptr [1000H],1

将使内存中的内容变为：

2000:1000 01 00 FF FF FF FF……

（3）其他方法

有些指令默认了访问的是字单元还是字节单元

比如：push [1000H]就不用指明访问的是字单元还是字节单元，因为push指令只进行字操作。

8.6寻址方式的综合应用

我们先通过一个实例来进一步讨论各种寻址方式的作用。

关于DEC公司的一条记录（1982年）：

公司名称：DEC

总裁姓名：Ken Olsen

排名：137

收入：40

著名产品：PDP

1988年DEC公司的信息有了变化：

1、Ken Olse在富翁榜上的排名已升至38位；

2、DEC的收入增加了70亿美元；

3、该公司的著名产品已变为VAX系列计算机。

任务：编程修改内存中的过时数据。

汇编语言个人学习笔记——第八章数据处理的两个问题

首先，我们应该分析一下要修改的数据：

（1）（DEC公司记录）的（排名字段）

（2）（DEC公司记录）的（收入字段）

（3）（DEC公司记录）的（产品字段）的（第一个字符）、（第二个字符）、（第三个字符）

从要修改的内容，我们就可以逐步地确定修改的方法：

（1）我们要访问的数据是DEC公司的记录，所以，首先要确定DEC公司记录的位置：R=seg:60

确定了公司记录的位置后，我们下面就进一步确定要访问的内容在记录中的位置。

（2）确定排名字段在记录中的位置：0CH。

（3）修改R+0CH处的数据。

（4）确定收入字段在记录中的位置：0EH。

（5）修改R+0EH处的数据。

（6）确定产品字段在记录中的位置：10H。要修改的产品字段是一个字符串（或一个数组），需要访问的zi'f字符串中的每一个字符。所以我们要进一步确定每一个字符在字符串中的位置。

（7）确定第一个字符在产品字段中的位置：P=0。

（8）修改R+10H+P处的数：P=P+1。

（9）修改R+10H+P处的数据：P=P+1。

（10）修改R+10H+P处的数据。

根据上面的分析，程序如下：

汇编语言个人学习笔记——第八章数据处理的两个问题

如果用C语言来描述，大概是这样的;

汇编语言个人学习笔记——第八章数据处理的两个问题

在按照C语言的风格，用汇编语言写一下这个程序，和C语言进行对比：

汇编语言个人学习笔记——第八章数据处理的两个问题

我们可以看到，8086CPU提供的如[bx+si+idata]的寻址方式为结构化数据的处理提供了方便。

使得我们可以在编程的时候，从结构化的角度去看待所要处理的数据。

从上面我们可以看到，一个结构化的数据包含了多个数据项，而数据项的类型又不相同，有的是字型数据，有的是字节型数据，有的是数组（字符串）。

一般来说，我们可以用[bx+idata+si]的方式来访问结构体中的数据。

用bx定位整个结构体，用idata定位结构体中的某一个数据项，用si定位数组项中的每个元素。（很通用的用法）

为此汇编语言提供了更为贴切的书写方式。

如：[bx].idata、[bx].idata[si]。

在C语言程序中我们看到，如：

dec.cp[i]，dec是一个变量名，指明了结构体变量的地址，cp是一个名称，指明了数据项cp的地址，而i用来定位cp中的每一个字符。

汇编语言中的做法是：bx.10h[si]

8.7div指令

div是除法指令，使用div作除法的时候要注意：

除数：8位或16位，在寄存器或内存单元中

被除数：（默认）放在AX或DX和AX中

除数被除数

8位 16位（AX）

16位 32位(DX+AX)

结果：

运算 8位 16位（除数）

商 AL AX

余数 AH DX

div指令格式：

div 寄存器

div 内存单元

示例：

div byte ptr ds:[0]

含义为：(al)=(ax)/((ds)*16+0)的商；

(ah)=(ax)/((ds)*16+0)的余数

div word ptr es:[0]

含义为：

(ax)=[(ds)*10000H+(ax)]/((ds)*16+0)的商；

(dx)=[(dx)*10000H+(ax)]/((ds)*16+0)的余数

div byte ptr [bx+si+8]

含义：

(al)=(ax)/((ds)*16+(bx)+(si)+8)的商；

(ah)=(ax)/((ds)*16+(bx)+(si)+8)的余数

div word ptr [bx+si+8]

含义：

(ax)=[(dx)*10000H+(ax)]/((ds)*16+(bx)+(si)+8)的商；

(dx)=[(dx)*10000H+(ax)]/((ds)*16+(bx)+(si)+8)的余数

练习：

编程：利用除法指令计算100001/100。

我们首先分析一下，被除数100001大于65535，不能用ax寄存器存放，所以我们要用dx和ax两个寄存器联合存放100001，也就是说要进行16位的除法。

除数小于255，可以在一个8位寄存器中存放，但是，因为被除数是32位的，除数应为16位，所以要用一个16位寄存器来存放除数100。

因为要分别为dx和ax赋100001的高16位值和低16位值，所以应先将100001表示为十六进制形式：186A1H。

代码如下：

assume cs:code
code segment
start :mov ax,86a1h
mov dx,0001h
   mov bx,100
   div bx

   mov ax,4c00h
   int 21h
code ends
end start

执行之后，(ax)=03E8H(即1000），(dx)=1(余数为1）。

汇编语言个人学习笔记——第八章数据处理的两个问题

练习2：

编程：利用除法指令计算1001/100。

我们首先分析一下被除数1001可用ax寄存器存放，除数100可用8位寄存器存放，也就是说，要进行8位的除法。程序如下：

assume cs:code
code segment
start:mov ax,1001
mov bl,100
   div bl

   mov ax,4c00h
   int 21h
code ends
end start

程序执行后，(al)=0AH(即10)，(ah)=1（余数为1）。

8.8伪指令 dd

前面我们用db和dw定义字节型数据和字型数据。

dd是用来定义dword（double word双字）型数据的。

示例：

data segment

db 1

dw 1

dd 1

data ends

在data段中定义了三个数据：

第一个数据为01H，在data:0处，占1个字节：

第二个数据为0001H，在data:1处，占1个字；

第三个数据为00000001H，在data:3处，占2个字；

问题8.1

用div计算data段中第一个数据除以第二个数据后的结果，商存放在第三个数据的存储单元中。

data segment
dd 100001
dw 100
dw 0
data ends

data段中的第一个数据是被除数，为dword（双字）型，32位，所以在做除法之前，用dx和ax存储。应将data:0字单元中的低16位存储在ax中，data:2字单元中的高16位存储在dx中。

assume cs:code,ds:data

data segment
dd 100001
dw 100
dw 0
data ends

code segment
start :mov ax,data
mov ds,ax
   mov ax,ds:[0]
   mov dx,ds:[2]
   div word ptr ds:[4]
   mov ds:[6],ax

   mov ax,4c00h
   int 21h
code ends
end start

汇编语言个人学习笔记——第八章数据处理的两个问题

8.9dup

dup是一个操作符，在汇编语言中同db、dw、dd等一样，也是由编译器识别处理的符号。

dup是和db、dw、dd等数据定义伪指令配合使用的，用来进行数据的重复。

示例：

db 3 dup (0)

定义了三个字节，它们的值都是0，相当于db 0,0,0

db 3 dup (0,1,2)

定义了9个字节，它们是0、1、2、0、1、2、0、1、2，相当于db 0,1,2,0,1,2,0,1,2

db 3 dup('abc','ABC'）

定义了18个字节，它们是'abcABCabcABCabcABC'，相当于db 'abcABCabcABCabcABC'

可见，dup的使用格式如下：

db 重复的次数 dup （重复的字节型数据）

dw 重复的次数 dup （重复的字型数据）

dd 重复的次数 dup （重复的双字数据）

dup是一个十分有用的操作符

比如我们要定义一个容量为200个字节的栈段，如果不用dup，则必须用这样的格式：

stack segment

dw 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0

stack ends

当然，我们可以用dd，使程序变得简短一些，但是如果要求定义一个容量为1000字节或10000字节的，即使用dd还是很繁琐。

用dup就可以轻松解决。如下：

stack segment

db 200 dup (0)

stack ends