【问题标题】:Remove html/text from RSS feed description except images从 RSS 提要描述中删除除图像外的 html/文本
【发布时间】:2014-09-26 13:37:54
【问题描述】:

我正在使用 WordPress 建立一个博客,它使用插件来导入 RSS 提要并按计划自动将它们发布到博客。

我只想从描述中提取图像,而不是有时与它们一起出现的文本或其他 html 元素。

一篇文章中可能有多张图片,每张图片都有标题或链接。

理想情况下,我想使用 Yahoo Pipes 获取提要,然后使用正则表达式运算符将除 <img> 元素之外的所有内容替换为空白。然后将处理后的提要发送到 WP 插件。

到目前为止,我只设法删除段落,使用:<p>.*?</p>。但在某些情况下,有没有包含在标签等中的纯文本。

任何帮助表示赞赏:) 我是一个正则表达式新手。

【问题讨论】:

标签: html regex wordpress rss


【解决方案1】:

您可以尝试使用它从 html 代码中获取所有图像。

preg_match_all('/<img[^>]+>/i',$html, $allimages); 
print_r($allimages);

如果您希望图像以字符串格式存储,则将implode, 结合使用

【讨论】:

  • 谢谢。我使用 PHP 获取 RSS 提要,然后使用 preg_match 遍历项目以查找图像,然后将文件作为 RSS 输出,其中包含仅包含图像的新标题和描述字段(使用 htmlspecialchars)。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多