【发布时间】:2015-01-12 23:30:17
【问题描述】:
我正在制作一个大型 yahoo 管道项目,该项目从各种来源获取 DJ 集,对其进行过滤,以便输出仅包含我过滤的艺术家的 dj 集,并将它们呈现在 RSS 提要中。
由于多个集合同时发布在多个网站上,但标题略有不同,因此尽管使用了独特的过滤器,但我的提要经常有重复的项目。
我注意到大多数这些集合都以 dj 名称开头。只有最后的字符串有所不同(有时会添加国家名称,或者日期以不同的格式显示)
我想要做的是,唯一的过滤器仅基于第一个单词。因此,如果添加这 2 个集合:
Dave Clarke - White Noise #471 - 2014 年最佳(电子版) - 2015 年 1 月 11 日
Dave Clarke – White Noise 471(2014 年最佳电子)– 2015 年 1 月 12 日
独特的过滤器会根据前 2 个词过滤掉其中一个词。
如果我只根据前 2 个名字进行过滤,这意味着唯一的过滤器会屏蔽掉这个 dj 课程的所有未来集合。为了避免这种情况发生,我想添加某种公式,以确保发布日期也被考虑在内。假设我每周每个 dj 只想要 1 件商品。
我知道这很复杂,但有可能吗?
谢谢!
【问题讨论】:
标签: string date rss unique yahoo-pipes