【发布时间】:2017-03-29 11:28:14
【问题描述】:
我想从这个页面上刮图片http://www.ikea.com/us/en/catalog/products/S59163189/
显示图像的标记如下:
<div id="moreImgThumbContainer">
<div class="imageThumb" id="imageThumb_0">
<a href="javascript:void(0);" id="imageThumbLink_0" class="active">
<img src="/PIAimages/0386819_PE559167_S3.JPG" onclick="irwStatThumbImgClickedFromPIP();" onmouseover="addOpacityEffect(this.id);" onmouseout="rmvOpacityEffect(this.id);" id="imgID_0" style="opacity: 10;">
</a>
</div>
<div class="imageThumb" id="imageThumb_1">
<a href="javascript:void(0);" id="imageThumbLink_1">
<img src="/PIAimages/0449646_PE599007_S3.JPG" onclick="irwStatThumbImgClickedFromPIP();" onmouseover="addOpacityEffect(this.id);" onmouseout="rmvOpacityEffect(this.id);" id="imgID_1" style="opacity: 0.8;">
</a>
</div>
</div>
我尝试在单个页面中使用 html 代码,它可以工作。
foreach($html->find('img[id^=imgID]') as $img_link){
$img_array[] = 'http://www.ikea.com'.$img_link->src;
$images = implode(';', $img_array);
}
如何使用此 api http://simplehtmldom.sourceforge.net/ 在 PHP html dom 解析器中获取每个图像的 src ?
编辑:我认为我找到了问题的原因,图像正在使用 ajax 加载并且需要时间来加载。
有没有办法刮掉它们?
请帮忙!
【问题讨论】:
-
使用
jQuery你想要所有图片src? -
如果图片由
ajax动态加载,那么你需要分析js或ajax请求/响应,而不是html dom
标签: php html parsing dom simple-html-dom