【问题标题】:How do I get a full article with description and image using Yahoo pipes?如何使用 Yahoo 管道获得包含描述和图像的完整文章?
【发布时间】:2012-06-14 12:16:39
【问题描述】:

http://bit.ly/4z5IFj

此 rss 提要不包含帖子图片,可能是因为该网站的图片排列不当。图片超过标题,图片也不完整(如css)

示例帖子:http://bit.ly/LEj3tj

<div id="newsItemComplete">
<p><img src="news_images/712315777drugs1.jpg" alt="Over 19,000 suspects ...." /></p>

<h2 class="completeNewsTitle" style="margin-top:10px;">Over 19,000 suspects ....</h2>   

<p class="newsDateStamp"  style="width:100%; float:left; margin:0;">June 14, 2012&nbsp;&nbsp;05:04 pm</p>
</div>

<div class="newsContent"  style="width:100%; float:left; clear:both; margin-bottom:5px;"> 

<p>The police have seized ....</p>         
</div> 
</div>
<div class="clearFix"></div>

<!-- control:news headline item ends here --><!-- control:category list starts here -->
<!-- control:category list ends here -->
<!-- headline news article  -->

我想获取描述对应的全文并获取图片, 谁能帮忙?

【问题讨论】:

  • 不要使用外部链接。而是在问题中显示您正在使用的数据的合理子集。注意 RSS 提要包含足够的数据来解析其标题中的相对 URL,例如 news_images/12345/blah.jpg。这些数据可能在包装器中。

标签: regex rss yahoo-pipes


【解决方案1】:

做得很好,但它并不完全正确。

当您将管道输出放入网页时,不会显示任何图像,因为链接是 相对 到原始网站而不是您的网站。您可以使用正则表达式模块插入缺少的 URL 的其余部分并使链接绝对,但原始网站将不满意您热链接到他们的图片。

Yahoo 管道无法获取图像,只能获取到它们的链接。让您的网站获取这些图像的副本有点复杂,最好使用 PHP 从您的网站服务器进行所有抓取。

其他需要注意的 Fetch Page 模块可能会在六个月或更短的时间内消失,因此您确实需要开始使用 XPATH Fetch Page 模块现在。

这是一个不完整的管道,可根据您的要求帮助您入门。 http://pipes.yahoo.com/pipes/pipe.info?_id=d7aba8c124693f3af888838ca12ac547

顺便说一句不要忘记将您自己的 ID 代码换成广告和“喜欢”按钮,或者使用正则表达式模块将它们完全删除

【讨论】:

    【解决方案2】:

    我自己修好了,这里是截图。 它获取链接并获取我想要的部分并将其复制到描述中。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-12-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-08-02
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多