【发布时间】:2011-09-19 02:23:22
【问题描述】:
我正在尝试使用简单的 html dom 从看起来像这样的文件中提取元素。
- 该文件有几个看起来相同的表
class=sometable。 - 每个表都有几个
<tr class=sometr>。 - 然后在每个 tr 中,我有一个带有标题的
th和一个带有类别的 td。
我要提取的是所有表中所有表行的所有标题class=title 及其对应的类别编号class=category。我已经在$html 中加载了文件。有人能告诉我在那之后我应该找到什么吗?我什至尝试过$collection = $html->find('tr'); 并对集合进行了vardump,但一无所获,所以看起来我选择不正确。
<table class="sometable">
<tbody>
<tr class="sometr">
<th><a class="title">Table 1 Title1</a></th>
<td class="category" id="categ-113"></td>
<td class="somename">Table 1 Title 1 name</td>
</tr>
<tr></tr>
<tr></tr>
</tbody>
</table>
<table class="sometable">
</table>
<table class="sometable">
</table>
【问题讨论】:
标签: php screen-scraping simple-html-dom