【发布时间】:2016-06-23 11:11:31
【问题描述】:
我使用包含多个句子的 Excel 文件。我想生成新属性(我使用“生成属性”运算符),如果句子包含一些数字,它们之间有空格(例如 234 45 56),则返回(“真或假”)。我使用了函数“匹配名义正则表达式”(matches(sentences,"\d+\s+\d))来做到这一点。但是,我遇到了 Rapidminer 无法识别转义 () 字符的问题。如何更改我的正则表达式以使其正常工作?
一些额外的 cmets/例子:
我输入的句子:
word word 123 345 6665 23456 54 word word word
word word word 12.3 34.5 6665 23.456 5.4 word word word
word word word 12,3 34,5 6665 23,456 5.4 word word word
word word word 12,3% 34,5% 6665% 23,456% 5.4% word word word
如果句子包含这样的数字链,我的输出将是具有真假的新变量。
我首先想到使用以下正则表达式来捕获数字 \d+[.,]?\d*\s+\d+[.,]?\d*.
【问题讨论】:
-
举个例子,你的输入和输出如何?
-
试试
match(sentences,".*\d\s+\d.*")或match(sentences,".*[0-9] +[0-9].*") -
@In777:试过我的建议了吗?
-
@Wiktor Stribiżew 谢谢你的帮助,第一个不起作用,因为\。第二个似乎工作正常。
标签: java regex rapidminer