【问题标题】:Javacc Unreachable StatementJavacc 不可达语句
【发布时间】:2013-12-29 11:12:21
【问题描述】:

在我的语法中,最初包含间接左递归的表达式和片段的产生规则。这是我从它们中删除递归后的规则。

String expression() #Expression : {String number; Token t;}
{
    number = fragment()
    (
        (t = <Mult_Sign> number = fragment())
    )
    {return number;}
}

String fragment() #void : {String t;}
{
    t = identifier() {return t;}
    | t = number() {return t;}
    | (<PLUS> | <MINUS> ) fragment()
    | <LBR> expression() <RBR>
}

在尝试解析语法中的条件时会使用这些产生式规则。然而,生产规则的顺序要么有它,所以只接受表达式。然而它应该接受像 while (x

void condition() #void : {Token t;}
{
    <NOT> expression()
    | expression (<EQUALS>|<NOTEQUALS>|<LT>|<GT>|<LTE>|<GTE>|<AND>|<OR>) expression()
    | identifier()
}

如果有人可以帮助告诉我为什么会出现这个问题,那将非常有帮助。

【问题讨论】:

    标签: parsing compiler-construction javacc unreachable-statement


    【解决方案1】:

    你有

    void condition() #void : {Token t;}
    {
    /*a*/     <NOT> expression()
    /*b*/     | expression (<EQUALS>|<NOTEQUALS>|<LT>|<GT>|<LTE>|<GTE>|<AND>|<OR>) expression()
    /*c*/     | identifier()
    }
    

    如果解析器正在寻找一个条件,它将尝试根据输入的下一个标记在三个备选方案之间做出选择。如果该令牌是标识符,则存在问题,因为备选方案 (b) 或备选方案 (c) 都可以工作。面对选择冲突,JavaCC 更喜欢第一个,所以会选择 (b)。如果下一个标记不是标识符,则不会选择替代项 (c)。因此,无论哪种方式(c)都不会达到。


    那是你的问题。应该怎么做?这是通常的解决方案。

    如果您想在表达式中允许更多运算符,请使用更多非终结符来表示更多优先级。例如

    condition --> expression
    expression --> disjunct (OR expression)?
    disjunct --> conjunct (AND disjunct)?
    conjunct --> comparand ((EQ|NEQ|LT|GT|LE|GE) comparand)?
    comparand --> term ((PLUS|MINUS) term)*
    term --> fragment ((TIMES | DIVIDE) fragment)*
    fragment --> identifier | number | LBR expression RBR | (PLUS|MINUS|NOT) fragment
    

    这个语法会接受你想要的一切,甚至可能更多。例如,如果您有

    statement --> WHILE condition DO statement
    

    您的解析器将接受例如“而 a+b 做 a:=b”。在许多语言中,这是通过类型检查来处理的; Java 就是这样做的。在其他语言中,它是通过允许各种事物作为条件来处理的。 LISP 会这样做。


    关于 NOT 优先级的说明

    大多数语言都将 NOT 的优先级视为非常高,就像本答案的第二部分一样。由于语法为 LL(1),因此消除所有选择警告的效果很好。

    但是,如果您希望一元运算符具有较低的优先级,那么如果您使用 JavaCC,那么真的没有什么能阻止您。例如。您可以将片段更改为

    fragment --> identifier | number | LBR expression RBR | (PLUS|MINUS) fragment | NOT conjunct
    

    现在语法不是 LL(1)(它甚至不是明确的)。所以JavaCC会给出一些选择冲突警告。但它实际上会解析例如"NOT a LT b" 改为 "NOT (a LT b)"


    我认为您正在尝试做的几乎没有语言所做的就是限制语法,以便仅允许看起来像条件​​的表达式成为条件。如果这确实是您想要的,那么您可以使用 JavaCC 使用语法前瞻来实现。这是你的做法。

    从这样的语法开始。 (这本质上是您的想法,更多地关注优先级。)

    condition --> disjunct (OR condition)?
    disjunct --> conjunct (AND disjunct)?
    conjunct --> expression (EQ|NEQ|LT|GT|LE|GE) expression
               | LBR condition RBR
               | NOT conjunct
               | identifier
    
    expression --> term ((PLUS|MINUS) term)*
    term --> fragment ((TIMES | DIVIDE) fragment)*
    fragment --> identifier | number | LBR expression RBR | (PLUS|MINUS) fragment
    

    这是一个明确的条件语法。但是,当下一个标记是标识符或 LBR 时,它会在连接时出现选择冲突。为了解决这种选择冲突,您可以使用语法前瞻来预测比较运算符

    void conjunct() : { } {
        LOOKAHEAD( expression() (<EQ>|<NEQ>|<LT>|<GT>|<LE>|<GE>) )
        expression() (<EQ>|<NEQ>|<LT>|<GT>|<LE>|<GE>) expression()
    |   LBR condition() RBR
    |   NOT conjunct()
    |   identifier() {
    

    那么为什么(几乎)没有编程语言这样做呢?大多数语言都有布尔类型的变量,所以像你一样,允许标识符作为条件。因此,您仍然需要进行类型检查以排除“WHILE i DO ...”,其中“i”不是布尔类型。另外,赋值语法应该使用什么?你需要

    statement --> identifier := (expression | condition) | ...
    

    即使是语法前瞻也不会告诉您哪个选项适合“x := y”。这是一个模棱两可的语法。

    如果在两种选择都解析的情况下任何一种选择都可以接受,那么您也可以在此处使用语法前瞻。

    void statement() : {} {
        identifier <BECOMES> (LOOKAHEAD(condition()) condition()) | expression())
    | ...
    }
    

    这会将“x:=y”中的“y”解析为条件,即使它是数字。如果您意识到这一点并设计了编译器的其余部分,那么一切仍然可以正常工作,那么不会造成任何伤害。

    这种方法的另一个缺点是解析现在是理论上的二次时间。我认为这不是一个严重的问题。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-01-01
      • 2013-10-18
      • 2013-09-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多