【发布时间】:2015-02-19 07:10:58
【问题描述】:
我有一个 100MB 的纯文本数据库文件,我想将其解析并转换为数据结构以便于访问。环境是perl和cygwin。由于我们从第三方接收带有数据的纯文本文件,因此我无法使用任何现有的解析器,如 xml 或 google 协议缓冲区。
文本文件如下所示。
Class=Instance1
parameterA = <val>
parameterB = <val>
parameterC = <val>
ref = Instance2
Class=Instance2
parameterA = <val>
parameterB = <val>
parameterC = <val>
该文件包含大量的类变体。
解析这个的最佳选择是什么? yacc/lex 会帮助我还是我应该编写自己的 perl 解析器?
【问题讨论】:
-
你的预期输出是什么?'
-
是的,您已经使用 YACC/LEX 自定义解析文件,并且您已经在珍珠中构建了一个正则表达式
-
@BhargavModi : regec in Pearl ???
-
@serenesat 我应该发布一个演示答案,但这只是一个想法目的吗?
-
@BhargavModi:珍珠???如果您的意思是
perl,那么又是拼写错误。
标签: regex perl parsing data-structures perl-data-structures