一次性代码生成在生成条件代码方面存在一个小问题。典型的if 声明:
if CONDITION then ALTERNATIVE_1 else ALTERNATIVE_2
需要编译成这样的:
compute CONDITION
JUMP_IF_TRUE label1
JUMP_IF_FALSE label2
label1:
code for ALTERNATIVE_1
JUMP label3
label2:
code for ALTERNATIVE_2
JUMP label3
label3:
next statement
但是在生成CONDITION的代码时,不知道label1和label2在哪里,而在生成ALTERNATIVE_1和ALTERNATIVE_2的代码时,不知道在哪里label3 是。
这样做的一种方法是对标签使用符号名称,如上面的伪代码中所示,并在已知值时填写实际值。这需要在跳转语句中存储一个符号名称,这会使数据结构复杂化(特别是,您不能只使用二进制汇编代码)。它还需要第二遍,只是为了填写跳跃目标。
一种(可能)更简单的方法是只记住跳转语句的地址,并在目标地址已知时修补它。这称为“backpatching”,因为您返回并修补生成的代码。
事实证明,在许多情况下,您最终会得到多个分支到同一个标签。一个典型的例子是像 C 系列的 && 和 || 运算符这样的“短路”布尔值。例如,扩展原来的例子:
if (CONDITION_1 and CONDITION_2) or CONDITION_3 then ALTERNATIVE_1 else ALTERNATIVE_2
compute CONDITION_1
JUMP_IF_TRUE label1
JUMP_IF_FALSE label2
label1:
compute CONDITION_2
JUMP_IF_TRUE label3
JUMP_IF_FALSE label2
label2:
compute CONDITION_3
JUMP_IF_TRUE label3
JUMP_IF_FALSE label4
label3:
code for ALTERNATIVE_1
JUMP label5
label4:
code for ALTERNATIVE_2
JUMP label5
label5:
next statement
事实证明,对于简单的语言,只需要记住两个不完整的跳转语句(通常称为“真”和“假”)。因为可能有多个跳转到同一个目标,每一个实际上都是一个不完整跳转语句的链表,其中目标地址用于指向链表中的下一个跳转。因此,backpatching 遍历列表,在正确的目标中修补并使用原始目标找到需要修补的先前语句。
你所谓的标记(这是 yacc/bison 所指的“Mid-Rule Productions”的一个实例)与回补并没有真正的关系。它们可用于多种用途。在一次性代码生成中,经常需要在规则中间执行一些动作,回补只是一个例子。
例如,在假设的if 语句中,有必要在解析CONDITION 之前初始化backpatch 列表,然后在THEN 和ELSE 子句的开头进行backpatch。 (在整个 if 语句的解析结束时将触发另一个回补,但该回补将在规则的最终操作中。)
在规则中间执行操作的最简单方法是插入一个中间规则操作,这相当于插入一个带有操作的空“标记”产生式,如您指向的示例野牛文件中所示。