【发布时间】:2011-05-07 01:12:56
【问题描述】:
我正在尝试用 C++ 为 CSS 编写分词器,但我不知道如何编写分词器。我知道它应该是贪婪的,为每个令牌读取尽可能多的输入,理论上我知道如何将其放入代码中。
我查看了 Boost.Tokenizer,它看起来不错,但对我没有任何帮助。它确实是一个很好的分词器包装器,但问题在于编写分词器,即 Boost 术语中的 TokenizerFunction。
我不知道如何编写这个标记器,是否有任何“简洁”的方法,比如与 the syntax itself 非常相似的东西?
请注意,我不是在寻找解析器!我的应用程序不需要能够理解 CSS,只需将 CSS 文件读取为通用的内部标记化格式,处理一些事情并再次输出。
【问题讨论】:
-
请注意,文件结尾规则使得使用现成的标记器对 CSS 进行标记......很有趣。假设这是可能的。