【发布时间】:2011-11-11 19:18:09
【问题描述】:
我希望使用 curl 从远程服务器上抓取带有 div id 的 div 数据。实际上这是正则表达式的问题,我在变量中包含页面的内容,例如:
$url = "http://www.google.co.in/";
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$content = curl_exec($ch);
curl_close($ch);
获取数据数据的正则表达式的正确语法是什么,格式如下:
$content = "<div id="cat_list">
<h4>Browse by Category</h4>
<ul>
<li class="a"><a href="link1.php">category1</a></li>
<li class="b"><a href="link2.php">category2</a></li>
</ul>
</div>";
我需要这里的所有类别名称。
【问题讨论】:
-
正则表达式不太适合解析 HTML,最好的选择可能是 PHP Simple HTML DOM Parser (simplehtmldom.sourceforge.net)