【发布时间】:2011-06-16 18:53:01
【问题描述】:
虽然我不能泄露太多这方面的信息,但我正在考虑制作一个很大的网站,并且会有很多 pdf 文件。但是,磁盘空间并不便宜。我如何才能在不占用所有磁盘空间的情况下托管所有这些 pdf(用户也会发布它们)?
【问题讨论】:
虽然我不能泄露太多这方面的信息,但我正在考虑制作一个很大的网站,并且会有很多 pdf 文件。但是,磁盘空间并不便宜。我如何才能在不占用所有磁盘空间的情况下托管所有这些 pdf(用户也会发布它们)?
【问题讨论】:
也许对 PDF 的标记做一些检查?或者设置一个最大文件大小,可能是一组最大文件大小,具体取决于页数?
我正在使用 pdf2html 处理(=从中获取文本)PDF 文件。
很难说... PDF 中是否包含图像或其他会“缩小”kb 的数据?
【讨论】:
这有点像问你如何储存数万亿加仑的盐水,却不创造海洋。真的做不到。充其量,您将管理您的资源以减少空间。例如,如果您的 PDF 可以转换为表单,则它们只具有 xfdf 文件中嵌入图像的数据和链接,这可能会减少一个百分比。但当然有警告。 1) 如果您的 PDF 不是表格并且不能标准化,这将不起作用。 2)如果您的 PDF 大多只是 PDF 格式的图像,这根本没有帮助。
【讨论】: