【发布时间】:2015-03-09 02:47:01
【问题描述】:
我需要从 ERPNEXT.COM/User-Guide 获取特定数据以使其看起来像 https://drive.google.com/file/d/0B-uyX-vtnUFINnlhRWJ6cWNtMDg/view?usp=sharing
只是我想删除页眉和页脚,以便只保留主要的标题和带有图像的文章.. 我想在整个网站上执行此操作,并使用 php 或其他任何方式获取此数据,然后将其转换为 PDF。我正在使用 Acrobat pro 将这些网页转换为 PDF 并为用户制作用户指南 PDF。我也使用 httrack 下载完整的网站,但它会获取所有数据。
请提出一个完整的解决方案。
问候, 维沙尔·维尔马
【问题讨论】:
标签: php curl web-crawler fetch