从网站获取特定数据并将其转换为 PDF答案

【问题标题】：Fetch Specific Data From A website and Turn it into PDF从网站获取特定数据并将其转换为 PDF
【发布时间】：2015-03-09 02:47:01
【问题描述】：

我需要从 ERPNEXT.COM/User-Guide 获取特定数据以使其看起来像 https://drive.google.com/file/d/0B-uyX-vtnUFINnlhRWJ6cWNtMDg/view?usp=sharing

只是我想删除页眉和页脚，以便只保留主要的标题和带有图像的文章.. 我想在整个网站上执行此操作，并使用 php 或其他任何方式获取此数据，然后将其转换为 PDF。我正在使用 Acrobat pro 将这些网页转换为 PDF 并为用户制作用户指南 PDF。我也使用 httrack 下载完整的网站，但它会获取所有数据。

请提出一个完整的解决方案。

问候，维沙尔·维尔马

【问题讨论】：

标签： php curl web-crawler fetch

【解决方案1】：

使用此功能读取网址：

function fetchURL($URL) {
        $Max=200000;
        $handle = @fopen ($URL, "r");
        if ($handle === false){ return false; }
        $len = 0;
        $buffer = "";
        while (!feof($handle)){
            $queue = fgets($handle, 4096);
            $buffer .= $queue;
            $len = $len + strlen($queue);
            if($len > $Max){ fclose ($handle); unset($buffer); return 0; break;}else{continue;}
        }
        fclose ($handle);
        return $buffer;
    }

如果您想获取 pdf 仅检查该函数中的字符 substr(fetchURL([URL]),0,4) ==='%PDF'。该网址是pdf。就我而言，我将结果写入 file.pdf 中的磁盘。我希望这会有所帮助

【讨论】：