【发布时间】:2011-08-02 09:01:47
【问题描述】:
我正在尝试使用 curl 从网络获取一些数据。我有一个像somewebsite.com 这样的网址。在这个网站上,有一大堆 <divs> 有一个 class="control-element" 并且有这个标记:
<div class="control-element">
<a href="http://someurl.com/and/some/path">Anchor Text</a>
</div>
我应该如何提取每个链接的 url 和锚文本?我应该为此使用正则表达式吗?或者最好的方法是什么?
【问题讨论】:
标签: php regex parsing html-parsing