【问题标题】:Php simple html dom extracting certain imgphp简单的html dom提取某些img
【发布时间】:2016-06-05 07:32:53
【问题描述】:

有人对 PHP 简单的 html dom 解析器有所了解吗? 我已经阅读了Php simple html dom parser的文档

我想做的事情是在页面源上找到包含 drupal-images 的特定 img url。例如: “http://drupal-images.tv2.dk/sites/images.tv2.dk/files/t2img/2016/02/22/480x270/227713601-42562915-273368722d35758cde85a1320a6bb23b.jpeg”

并且只查找包含单词的图像:drupal-images。这可能吗?

到目前为止,我唯一做的就是从页面中提取所有图像,就像这样。

include("simplehtmldom_1_5/simple_html_dom.php");

$html = file_get_html("http://www.tv2.dk");
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';

如果您应该找到某些带有...的图像。 你会在 foreach 中使用正则表达式吗?

我能找到元数据吗?像这样: meta name="Generator" content="Drupal 7 (http://drupal.org)

我搜索了很多,似乎只能通过查找特定的 div 和类来找到。

提前致谢。

【问题讨论】:

    标签: php html dom web-scraping


    【解决方案1】:

    strpos() 可以帮助您:

        $str = 'drupal-images';
        $url = 'http://drupal-images.tv2.dk/sites/images.tv2.dk/files/t2img/2016/02/22/480x270/227713601-42562915-273368722d35758cde85a1320a6bb23b.jpeg';
        $urlArray = explode('/',$url);
        if(strpos($url, $str) > 0){
            $img = end($urlArray);
        }
    

    我相信你可以在你的代码中找到如何使用这个例子。

    关于元数据,你可以使用exif_read_meta(),更多可以在这里找到:http://php.net/manual/en/function.exif-read-data.php

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-07-06
      • 1970-01-01
      • 2013-12-26
      • 2018-02-03
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多