【发布时间】:2016-06-05 07:32:53
【问题描述】:
有人对 PHP 简单的 html dom 解析器有所了解吗? 我已经阅读了Php simple html dom parser的文档
我想做的事情是在页面源上找到包含 drupal-images 的特定 img url。例如: “http://drupal-images.tv2.dk/sites/images.tv2.dk/files/t2img/2016/02/22/480x270/227713601-42562915-273368722d35758cde85a1320a6bb23b.jpeg”
并且只查找包含单词的图像:drupal-images。这可能吗?
到目前为止,我唯一做的就是从页面中提取所有图像,就像这样。
include("simplehtmldom_1_5/simple_html_dom.php");
$html = file_get_html("http://www.tv2.dk");
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';
如果您应该找到某些带有...的图像。 你会在 foreach 中使用正则表达式吗?
我能找到元数据吗?像这样: meta name="Generator" content="Drupal 7 (http://drupal.org)
我搜索了很多,似乎只能通过查找特定的 div 和类来找到。
提前致谢。
【问题讨论】:
标签: php html dom web-scraping