【发布时间】:2016-06-07 19:59:04
【问题描述】:
我正在尝试使用simple_html_dom 和 php 来解析带有此标签的网页:
<div class=" row result" id="p_a8a968e2788dad48" data-jk="a8a968e2788dad48" itemscope itemtype="http://schema.org/JobPosting" data-tn-component="organicJob">
其中 data-tn-component="organicJob" 是我要解析的标识符,我似乎无法以 simple_html_dom 识别的方式指定文本。
我尝试了一些类似的方法:
<?PHP
include 'simple_html_dom.php';
$f="http://www.indeed.com/jobs?q=Electrician&l=maine";
$html->load_file($f);
foreach($html->find('div[data-tn-component="organicJob"]') as $div)
{
echo $div->innertext ;
}
?>
但是解析器没有找到任何结果,即使我知道它们在那里。可能我没有指定我正确找到的东西。 我正在查看the API,但我仍然不明白如何格式化查找字符串。 我做错了什么?
【问题讨论】:
标签: php parsing dom html-parsing