【发布时间】:2010-04-11 15:14:27
【问题描述】:
我有一个常规的、嵌套的 HTML 无序列表链接,我想用 PHP 抓取它并将其转换为数组。
原始列表如下所示:
<ul>
<li><a href="http://someurl.com">First item</a>
<ul>
<li><a href="http://someotherurl.com/">Child of First Item</a></li>
<li><a href="http://someotherurl.com/">Second Child of First Item</a></li>
</ul>
</li>
<li><a href="http://bogusurl.com">Second item</a></li>
<li><a href="http://bogusurl.com">Third item</a></li>
<li><a href="http://bogusurl.com">Fourth item</a></li>
</ul>
任何项目都可以有孩子。
(实际的屏幕抓取没有问题,我可以做到。)
我想把它变成一个 PHP 数组,只包含链接,同时保持列表的层次结构。有什么想法吗?
我研究过使用 htmlsimpledom 和 phpQuery,它们都使用类似 jQuery 的语法。但是,我似乎无法正确使用语法。我可以得到所有的链接,但我最终失去了层次结构和秩序。
谢谢。
【问题讨论】:
标签: php html screen-scraping