【发布时间】:2013-12-17 11:04:41
【问题描述】:
我需要根据用户输入过滤 url,但过滤器不能区分大小写。 例如,我的用户想要过滤以 Sewer.pdf 结尾的文件。 如果我创建这样的正则表达式:
+Sewer\.pdf$
工作正常,但是用户可能已经输入了 SEWER.PDF,它会跳过该文件。 我的解决方案是创建这样的规则:
+[Ss][Ee][Ww][Ee][Rr]\.[Pp][Dd][Ff]
不过,看起来应该在正则表达式中添加 /i 之类的东西,这样会更容易。
有谁知道如何以更好的方式做到这一点?
【问题讨论】:
标签: regex web-crawler nutch