提取不到dom节点值答案

【问题标题】：Can't get the dom node value extracted提取不到dom节点值
【发布时间】：2011-12-22 04:13:21
【问题描述】：

我有一个链接到另一个站点的代码，获取该数据，并将字符串返回给一个变量。我想知道为什么这不起作用？

<?php


$file = $DOCUMENT_ROOT . "http://www.sc2brasd.net";
$doc  = new DOMDocument();
@$doc->loadHTMLFile($file);


$elements = $doc->getElementsByTagName('h1');

for ($i=1; $i<=7; $i++)
  {
  echo trim($elements->item($i)->nodeValue);
  }

?>

我想抓取七个“h1”标签，但它们不会返回以回显？字符串的一个示例是“这是我要拉出的测试字符串”

【问题讨论】：

标签： php html dom screen-scraping

【解决方案1】：

这将不起作用，因为路径不存在。它指向您服务器上的一个文件。

$file = $DOCUMENT_ROOT . "http://www.sc2brasd.net";

我不确定 loadHTMLFile() 是否可以处理 URL。您可能需要使用 file() 获取文档并使用 DOMDocument::loadHTML 加载它。

【讨论】：

该网址是否正确并不重要。它仍然是一个 URL。它产生类似/etc/http://www.google.com 的东西，我不敢相信这是你试图解析的东西。