1 .有没有什么通用的方法可以将这种非 LALR(1) 文法转换为 LALR(1) 文法?
没有。将任意上下文无关文法 (CFG) 转换为 LALR(1) 文法可能会也可能不会。此外,如果您有 CFG 和 LALR(1) 语法,您无法判断它们是否识别相同的语言。 (更糟糕的是,没有算法可以告诉您任意 CFG 是否能够识别其字母表中所有可能的字符串。)
2 。如果两个文法生成完全相同的语言,并且我们知道一个不是 LALR(1),我们能知道另一个是否是 LALR(1)?
再次,不。如上所述,没有算法可以验证两种语法是否生成相同的语言,但即使假设您知道两种语法生成相同的语言,其中一个不是 LALR(1) 的事实并不能告诉您另一个一个。
但是,有一个有用的结果。如果你有一个有限 k > 1 的 LALR(k) 文法,那么你可以生成一个 LALR(1) 文法。换句话说,对于 k > 1,不存在 LALR(k) language 这样的东西;如果一种语言有 LALR(k) 文法,那么它对任何 k' 都有一个 LALR(k') 文法,满足 1 ≤ k'
但是,这对您的语法没有帮助,因为无法通过增加对任何有限值的前瞻来消除冲突。
不过,有一种简单的方法可以消除这种特殊的班次减少冲突,而且这种技术通常很有效。考虑两个相互冲突的规则:
lval := lval '[' expr ']'
expr := ID '[' expr ']' OF expr
问题在于,在第一种情况下,ID 必须立即减少为lval(或至少在以下expr 减少之前),但在第二种情况下它可能不会减少为@ 987654326@。但是在我们减少expr 并遇到OF(或没有)之前,我们无法判断我们处于哪种情况。
如果我们可以在不进行内部 lval 归约的情况下完成 lval 产生式,那么我们就不会有问题,因为当 ] 后面的标记可见时,实际的归约就会发生。
这可能有一个技术术语,但我不知道。我一直把它描述为“减少延迟”,而且在很多情况下并不是很困难:
lval' := ID `[` expr `]`
| lval' `[` expr `]`
lval := ID
| lval'
expr := lval
| ID '[' expr ']' OF expr