php简单的html dom提取某些img答案

【问题标题】：Php simple html dom extracting certain imgphp简单的html dom提取某些img
【发布时间】：2016-06-05 07:32:53
【问题描述】：

有人对 PHP 简单的 html dom 解析器有所了解吗？我已经阅读了Php simple html dom parser的文档

我想做的事情是在页面源上找到包含 drupal-images 的特定 img url。例如： “http://drupal-images.tv2.dk/sites/images.tv2.dk/files/t2img/2016/02/22/480x270/227713601-42562915-273368722d35758cde85a1320a6bb23b.jpeg”

并且只查找包含单词的图像：drupal-images。这可能吗？

到目前为止，我唯一做的就是从页面中提取所有图像，就像这样。

include("simplehtmldom_1_5/simple_html_dom.php");

$html = file_get_html("http://www.tv2.dk");
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';

如果您应该找到某些带有...的图像。你会在 foreach 中使用正则表达式吗？

我能找到元数据吗？像这样： meta name="Generator" content="Drupal 7 (http://drupal.org)

我搜索了很多，似乎只能通过查找特定的 div 和类来找到。

提前致谢。

【问题讨论】：

标签： php html dom web-scraping

【解决方案1】：

strpos() 可以帮助您：

    $str = 'drupal-images';
    $url = 'http://drupal-images.tv2.dk/sites/images.tv2.dk/files/t2img/2016/02/22/480x270/227713601-42562915-273368722d35758cde85a1320a6bb23b.jpeg';
    $urlArray = explode('/',$url);
    if(strpos($url, $str) > 0){
        $img = end($urlArray);
    }

我相信你可以在你的代码中找到如何使用这个例子。

关于元数据，你可以使用exif_read_meta()，更多可以在这里找到：http://php.net/manual/en/function.exif-read-data.php

【讨论】：