【问题标题】:Can't get the dom node value extracted提取不到dom节点值
【发布时间】:2011-12-22 04:13:21
【问题描述】:

我有一个链接到另一个站点的代码,获取该数据,并将字符串返回给一个变量。我想知道为什么这不起作用?

<?php


$file = $DOCUMENT_ROOT . "http://www.sc2brasd.net";
$doc  = new DOMDocument();
@$doc->loadHTMLFile($file);


$elements = $doc->getElementsByTagName('h1');

for ($i=1; $i<=7; $i++)
  {
  echo trim($elements->item($i)->nodeValue);
  }

?>

我想抓取七个“h1”标签,但它们不会返回以回显?字符串的一个示例是“这是我要拉出的测试字符串”

【问题讨论】:

    标签: php html dom screen-scraping


    【解决方案1】:

    这将不起作用,因为路径不存在。它指向您服务器上的一个文件。

    $file = $DOCUMENT_ROOT . "http://www.sc2brasd.net";
    

    我不确定 loadHTMLFile() 是否可以处理 URL。您可能需要使用 file() 获取文档并使用 DOMDocument::loadHTML 加载它。

    【讨论】:

    • 该网址是否正确并不重要。它仍然是一个 URL。它产生类似/etc/http://www.google.com 的东西,我不敢相信这是你试图解析的东西。
    猜你喜欢
    • 1970-01-01
    • 2011-01-31
    • 2015-05-20
    • 1970-01-01
    • 2017-01-19
    • 2014-03-20
    • 1970-01-01
    • 2020-06-21
    • 2013-06-11
    相关资源
    最近更新 更多