【问题标题】:Fetch Specific Data From A website and Turn it into PDF从网站获取特定数据并将其转换为 PDF
【发布时间】:2015-03-09 02:47:01
【问题描述】:

我需要从 ERPNEXT.COM/User-Guide 获取特定数据以使其看起来像 https://drive.google.com/file/d/0B-uyX-vtnUFINnlhRWJ6cWNtMDg/view?usp=sharing

只是我想删除页眉和页脚,以便只保留主要的标题和带有图像的文章.. 我想在整个网站上执行此操作,并使用 php 或其他任何方式获取此数据,然后将其转换为 PDF。我正在使用 Acrobat pro 将这些网页转换为 PDF 并为用户制作用户指南 PDF。我也使用 httrack 下载完整的网站,但它会获取所有数据。

请提出一个完整的解决方案。

问候, 维沙尔·维尔马

【问题讨论】:

    标签: php curl web-crawler fetch


    【解决方案1】:

    使用此功能读取网址:

    function fetchURL($URL) {
            $Max=200000;
            $handle = @fopen ($URL, "r");
            if ($handle === false){ return false; }
            $len = 0;
            $buffer = "";
            while (!feof($handle)){
                $queue = fgets($handle, 4096);
                $buffer .= $queue;
                $len = $len + strlen($queue);
                if($len > $Max){ fclose ($handle); unset($buffer); return 0; break;}else{continue;}
            }
            fclose ($handle);
            return $buffer;
        }
    

    如果您想获取 pdf 仅检查该函数中的字符 substr(fetchURL([URL]),0,4) ==='%PDF'。该网址是pdf。就我而言,我将结果写入 file.pdf 中的磁盘。我希望这会有所帮助

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2014-09-26
      • 2020-04-19
      • 2020-11-15
      • 2012-09-13
      • 1970-01-01
      • 2019-09-24
      • 1970-01-01
      相关资源
      最近更新 更多