【发布时间】:2011-12-14 06:48:08
【问题描述】:
我想从一段文本中提取所有的网址和标题。
Les <a href="http://test.com/blop" class="c_link-blue">résultats du sondage</a> sur les remakes et suites souhaités sont <a href="http://test.com" class="c_link-blue">dans le blog</a>.
由于以下正则表达式,我能够获得所有 href,但我不知道如何获得另外,<a></a> 标签之间的标题?
preg_match_all('/<a.*href="?([^" ]*)" /iU', $v['message'], $urls);
最好的办法是得到一个这样的关联数组
[0] => Array
(
[title] => XXX
[link] => http://test.com/blop
)
[1] => Array
(
[title] => XXX
[link] => http://test.com
)
感谢您的帮助
【问题讨论】:
-
在这个网站上的无数次,不要使用正则表达式来解析/处理 HTML。改用 DOM。 stackoverflow.com/questions/1732348/…
-
@EmmanuelN:你为什么要发布这个页面的链接?
-
谢谢大家,我要去研究DOM解析器了;)