【发布时间】:2012-09-19 12:27:17
【问题描述】:
我知道可以将参数传递给词法分析器:
rule tokenize scope = parse
| whitespace { tokenize scope lexbuf }
| newline { newline lexbuf; tokenize scope lexbuf }
但我无法以类似的方式定义解析器开始符号。
我试图这样定义它:(感谢this问题)
%type < (IScope, AST.Script) Fun > Script
// with the following definition in the head section of the parser:
type ('a,'b) Fun = 'a -> 'b
但是我必须像这样定义每个非终结符,它们都会返回 lambdas。不过,这不是我想要实现的,我希望能够在几个非终端中访问 scope 参数并在解析期间执行它们的操作。
我注意到IParseState 类型中有一个ParserLocalStore,它只包含LexBuffer(仅通过调试检查)。由于我可以在每个非终端中通过parseState 访问它,我是否可以在其中存储参数,或者这是一个坏主意?
我曾考虑在解析器的头部使用可变变量,但它们将是静态的(我认为?),这会阻止我同时解析多个输入......
编辑:
目前我将scope 参数存储在特定令牌中:
%token <string * IScope> IDENT
我将scope 传递给 Lexer,后者在创建它们时将其嵌入到相关标记中......我真的不喜欢这个解决方案,但我无法想出更好的东西。
【问题讨论】:
-
不是答案,但您考虑过 FParsec 吗?参数传递非常简单。
-
暂时没有。我们有另一个解析器项目即将推出,可能会在那里使用 ANTLR。如果我们(在某个时候)决定在当前项目中也使用 ANTLR,我可以更轻松地使用 fsyacc 进行移植。使用解析器组合器(至少据我所知)我没有非常清晰的语法,并且必须以完全不同的方式做所有事情,而 fsyacc / ANTLR 解析器的大部分结构似乎都是相似的。
标签: parsing f# fsyacc fslex f#-powerpack