【发布时间】:2013-01-08 18:25:09
【问题描述】:
好的,我有一个 RSS 源。每篇文章都包含多个 HTML 链接。它们都是同一个主机(例如 youtube.com),而不是一个主机不同的主机。 我正在尝试过滤这个链接。
所以目前,我有一个最常见主机(imgur、减号、tumblr 等)的规则列表,如下所示:
(?i).*?href="(https?://[^"]*host1[^"]*).*
(?i).*?href="(https?://[^"]*host2[^"]*).*
(?i).*?href="(https?://[^"]*host3[^"]*).*
问题是:总是有未知主机的链接。
所以我想要做的是,将主机从所有其他链接(都是相同的)“列入黑名单”。我读到了(?!regex),但它似乎不起作用:
(?i).*?href="(https?://[^"]*(?!youtube)[^"]*).*
我希望你能理解我的问题,并为我(可能)糟糕的英语感到抱歉!
【问题讨论】:
-
你使用什么编程语言?
-
我在 Yahoo Pipes 上使用 Regex...
标签: regex yahoo-pipes