【发布时间】:2011-05-13 20:31:44
【问题描述】:
我运行一个求职网站,我需要在运行 php 的 linux CentOS 服务器上将 doc、docx 和 pdf 文件转换为 HTML。人们将这些文件作为简历提交。到目前为止,我发现 PHPDocx 非常擅长将 docx 转换为 html。但我被困在 doc/pdf 上。当我运行测试时,PDFTOHTML 给出错误“错误颜色”。就文档而言,我只找到了 wvwave,它似乎安装起来复杂且笨重。
有人对如何轻松地将 doc/pdf 转换为 HTML 有任何想法吗?
【问题讨论】:
-
您有专用服务器还是使用分片托管?
-
PDF 转 HTML : stackoverflow.com/questions/16785198/…
-
PDF 转 HTML 基于 Xpdf : sourceforge.net/projects/pdftohtml
-
gs可以将任何 PDF(除非数据是嵌入图像)移植到 XML;我猜是 HTML。我不会将此作为答案发布,因为它在批处理模式下的 RAM 太重。 -
想知道您是否找到了可行的解决方案?在这里分享可能会有所帮助...