【发布时间】:2013-11-18 21:26:48
【问题描述】:
我正在使用此处开发的图像抓取功能:https://github.com/morshedalam/url-scraper-php
他们正在使用这个正则表达式来查找图像:
private $img_expression = '/<img[^>]+src=([\'"])?((?(1).+?|[^\s>]+))(?(1)\1)/';
这很好,但是,它会返回每一个图像(包括小图像)。很像 Pinterest、Facebook 等。我只对获取用作拇指的图像感兴趣,即宽度 > 200 像素。我意识到图像的尺寸可能没有在 html 源代码中定义。
你会怎么做?
干杯。
【问题讨论】:
标签: php web-scraping