【问题标题】:Ignoring outputs in Cascading忽略级联中的输出
【发布时间】:2013-05-29 19:55:30
【问题描述】:

我正在分析具有各种域名的日志文件。我想从输出报告中排除/忽略任何包含“macys”一词的域。这是一个示例输出:

l.macys.com        87516
www.google.com     3016
search.yahoo.com   584
www.bing.com       166
macys-L0135874392.htm   1

如果我看不到任何带有“macys”一词的域,我想拥有并输出文件。

【问题讨论】:

    标签: filtering logfile cascading-deletes cascading


    【解决方案1】:

    这听起来像是级联 Filter 的完美用例

    您可以使用RegexFilter 进行设置:

    Pipe pipe = new Pipe(incomingPipe, new Fields("UrlColumn"), 
         new RegexFilter(".*macys.*", true), Fields.All);
    

    根据您的匹配用例定制正则表达式。上面的一个将删除所有包含单词“macys”的元组(行)

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-08-07
      • 1970-01-01
      • 2014-11-16
      • 1970-01-01
      • 2020-08-19
      • 2015-06-07
      • 2013-01-22
      相关资源
      最近更新 更多