【发布时间】:2016-07-04 07:56:41
【问题描述】:
我得到了一个用一种元语言编写的文件,它描述了验证某些数据所需的过程。 我需要生成验证函数来验证数据。 数据已经存储在结构中
我做的步骤:
- 使用 char like(' . , ; == >= ) 将文本拆分为字符串 []
- 删除冠词、介词...
- 规范化文本(如何?)
- 使用正则表达式或文本匹配将单词与标记匹配
- 使用 Token 类型匹配模式
- 根据匹配的模式规则生成函数
您会在第 3 步或一般情况下使用什么来改进此过程?
【问题讨论】:
-
是什么输入法?英语?代码?一些常规模式的数据?
-
如果没有正确的输入/预期的输出,将很难提供任何帮助。就问题而言,它有点像在黑暗中闲逛......
标签: regex text pattern-matching normalization text-normalization