【发布时间】:2016-08-29 16:44:12
【问题描述】:
使用库simple_html_dom.php
$html = file_get_html($link);
这样的结构
<div class="ps">
<h3>Lorem ipsum 1</h3>
<p>Lorem ipsum 2</p>
<h3>Lorem ipsum 3</h3>
<p>Lorem ipsum 4</p>
<div class="extras250">
<div class="boxType3 naSkroty">
<div class="boxBody shortList">
<h3>Lorem ipsum 5</h3>
</div>
</div>
<div class="boxType4 wsparcie">
<div class="boxBody">
<h3>Lorem ipsum 6</h3>
<p>Lorem ipsum 7</p>
</div>
</div>
</div>
</div>
foreach ($html->find('.ps h3') as $naglowek) {
$info['naglowek'][$i] = $naglowek->plaintext;
$i++;
}
我想找到<h3>,但只有第一级(不是嵌套的),但 foreach 可以找到所有这些。这个怎么做 ?我试过了
foreach ($html->find('.ps > h3') as $naglowek)
但不起作用。
【问题讨论】:
标签: php html parsing html-parsing