【发布时间】:2015-06-29 01:55:44
【问题描述】:
我需要将格式化的 pdf 和 word 文档转换为 html。此转换用于将文档显示到 Web 浏览器中。进入网络浏览器,您还可以选择文本。我不知道在后端(例如使用 Java)或使用 php 是否更好,或者有一个 jquery/javascript 插件?
我的目标是在 iPaper 等网络浏览器中显示这些文档。
感谢您的帮助
【问题讨论】:
我需要将格式化的 pdf 和 word 文档转换为 html。此转换用于将文档显示到 Web 浏览器中。进入网络浏览器,您还可以选择文本。我不知道在后端(例如使用 Java)或使用 php 是否更好,或者有一个 jquery/javascript 插件?
我的目标是在 iPaper 等网络浏览器中显示这些文档。
感谢您的帮助
【问题讨论】:
您可以使用pdftohtml 并自动在服务器端运行它,或者用它批处理您的 pdf。
【讨论】:
这是我正在改进的 PowerShell 解决方案:
https://github.com/suzumakes/ReplaceIT
如果您遇到的问题是 Word 吐出大量垃圾并声称它是一个 HMTL 文件,那么这应该会有很大帮助。 iPaper 拥有如此庞大的团队是有原因的,那是因为您希望从文档中构建一个网页,通过单击按钮打印到网络,结果证明这非常困难。
【讨论】: