【问题标题】:Filter the RSS links based on keywords in their content in Yahoo Pipes根据 Yahoo Pipes 内容中的关键字过滤 RSS 链接
【发布时间】:2014-11-06 14:33:51
【问题描述】:

我正在使用 Yahoo Pipes 创建 RSS 提要,并尝试根据页面中使用的关键字过滤链接。我怎样才能做到这一点?请注意,我只有数据中的链接。

一个例子是我有链接: http://blogs.technet.com/b/dataplatforminsider/archive/2014/11/05/microsoft-announces-major-update-to-azure-sql-database-adds-free-tier-to-azure-machine-learning.aspx

要在内容中查找的关键字:“大数据”

感谢任何帮助。

【问题讨论】:

    标签: rss yahoo-pipes


    【解决方案1】:

    为什么不像这个例子那样只使用一个简单的过滤器:http://pipes.yahoo.com/pipes/pipe.info?_id=0cdc25a071d30ef0b85331394d939c2d

    提要 URL 是从您作为示例提供的页面上的提要链接中获取的。

    【讨论】:

    • 感谢您的回答。我试图完全加载整个页面,然后使用关键字过滤结果。看起来,抓取提要不会加载整个页面
    • 您通常不想加载整个页面 - 网站 chrome、广告和各种其他垃圾页面?或者,也许您想通过实际内容周围的文本来检测页面?
    • 你是对的。我的意思是整个帖子(周围没有垃圾)通常使用 Fetch Feed 你会看到 3-4 行,然后看到“阅读更多......”
    • 方法是抓取提要,然后为提要中的每个 url/链接加载整个页面。根据接受的答案:-)
    【解决方案2】:

    我最终使用 Fetch Page in a Loop 来加载整个数据,然后对其进行过滤。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-08-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多