【发布时间】:2011-07-12 19:42:11
【问题描述】:
我需要一些方法来搜索大量 HTML 以获取 youtube 和 vimeo 视频。一些文本使用嵌入的 iframe 类型,而另一些则使用嵌入标签。我需要执行以下操作:
搜索嵌入标签 - 检查他们是 youtube 还是 vimeo
搜索 iframe 标签 - 检查他们是 youtube 还是 vimeo
然后我想将它们输入到一个数组中,如下所示:
array(type=>'youtube', video_id=>'12qfsdf9jr');
或用于 vimeo
array(type=>'vimeo', video_id=>'lkaj82932');
如果它有所作为,它将搜索大量的 wordpress 帖子。请让我知道如何实现这一点!
【问题讨论】:
-
循环浏览页面上找到的所有 URL 可能是最简单的方法,然后尝试匹配这些 URL 并删除重复项。嵌入代码太容易更改,无法为它们编写可靠的正则表达式。
-
好的。好吧,进一步缩小范围,我知道嵌入和 iframe 中始终包含 src="url" 我怎么能搜索 src= 然后从中获取 URL?
标签: php regex full-text-search youtube vimeo