【发布时间】:2014-08-05 21:15:59
【问题描述】:
我知道有一个亚马逊 API 可以用来提取他们的数据,但我只是想学习自己的知识,从亚马逊提取数据似乎是一个很好的测试。
<?php
ini_set('display_errors',1);
ini_set('display_startup_errors',1);
error_reporting(-1);
include('../includes/simple_html_dom.php');
$html = file_get_html('http://www.amazon.co.uk/gp/product/B00AZYBFGY/ref=s9_simh_gw_p86_d0_i1?pf_rd_m=A3P5ROKL5A1OLE&pf_rd_s=center-2&pf_rd_r=1MP0FXRF8V70NWAN3ZWW&pf_r$')
foreach($html->find('a-section') as $element) {
echo $element->plaintext . '<br />';
}
echo $ret;
?>
我想做的只是从链接中提取产品描述,但我不确定它为什么会起作用。真的,我没有收到任何错误或任何数据。
【问题讨论】:
-
一方面,您的代码存在语法问题。带有您的 URL 的行不以撇号结尾来关闭字符串。
-
如何选择一个没有明确违反他们条款的网站。
-
抱歉,解决了 URL 的问题,但这是我复制和粘贴的问题,并且不在脚本中。
标签: php web-scraping