【问题标题】:Parameter String in Filter Examples Rapidminer过滤器示例中的参数字符串 Rapidminer
【发布时间】:2018-08-12 17:49:57
【问题描述】:

我有一个来自 twitter 的数据集。我需要删除与特定单词相关的推文。 我使用了“过滤示例”运算符并选择了“条件类”->“属性值”。我遵循了 Rapidminer 指南,但它不起作用。 它说:

"当条件类选择参数'attribute_value_filter'时,该参数可用。条件格式为属性名称,后跟比较函数和要匹配的值。 名义属性可以通过 = 和 != 与任意字符串进行比较,该字符串也可以包含正则表达式。"

因此,我输入: text{=strike!=} 也试过: text=strike!=

'text' 是我的属性的名称 'strike'是我要删除的词。

但是,我收到了这个错误:

有人可以指出我做错了什么吗?我尝试了几种变体,但由于某些白痴原因,它不起作用。

请善待我在这方面很新,我的论文真的需要它。非常感谢!!!

【问题讨论】:

    标签: parameters rapidminer


    【解决方案1】:

    要过滤掉包含某个单词的推文,您需要使用正则表达式语法。 最简单的表达方式是:

    text != .*strike.* 但这也会过滤掉 strike 是另一个词的一部分的文本,所以 可能更适合的是:

    text != .*\sstrike[\s\.\!\,\.\:$].
    

    阅读为:过滤掉 text 中的任何示例,其中在罢工之前是任意字符和空格,然后是空格、标点符号或行尾。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-01-21
      • 2011-09-29
      • 2018-03-31
      • 2017-04-16
      • 1970-01-01
      • 2015-06-09
      • 1970-01-01
      相关资源
      最近更新 更多