【问题标题】:Creating a system that can display doc, docx, pdf in the browser创建一个可以在浏览器中显示doc、docx、pdf的系统
【发布时间】:2012-02-23 00:39:01
【问题描述】:

我目前正在开发一个将作为 FTP 服务器前端的 Web 应用程序。服务器包含数千个 pdf/doc/docx 文件,并且每个月他们都会添加几十个,有时接近一百个文件。

我们当前的应用程序使用 openoffice 将文件转换为 pdf。比我们使用 pdf2swf 将文件转换为我们在浏览器中显示的 swf 对象。在新应用程序中,所有数据都在 FTP 服务器中,我们无法存储/创建 swf 文件。

我们需要先将 url 解析为服务器上的某个资源,而不是将其下载到另一台机器并在浏览器中显示文档。

有没有一种方法(最好在 python 中)可以相对快速地生成我们使用的 swf 对象?

一个更好的解决方案是像谷歌的文档查看器 api,但不幸的是他们的 TOS 不批准这样的使用: “您不得使用该服务开发可视文档搜索和预览应用程序,该应用程序将 Google Docs Viewer 的多种用途嵌入到 DOC、DOCX 或 PPTX 文件类型的单个网页中。”

【问题讨论】:

  • 因为当前的应用程序已经用 python 编写了一些 shell 脚本。我们不打算完全重写应用程序,只是文件功能。但这只是一种偏好,只要有一个好的解决方案我不介意一起发光不止一种语言。

标签: python docx documents


【解决方案1】:
  1. 对于 PDF,您可能有兴趣使用由 Mozilla 团队完成的完整 javascript 实现:pdf.js。您只需要使用您的 python 服务器提供 pdf.js 文件 + pdf :)

  2. 对于 doc/docx,您可以使用 openoffice tools 将它们转换为 PDF。然后回到1。:)(如果你还想自己写那部分,unoconv是用Python写的,使用Python-UNO bridge

【讨论】:

  • 感谢您的重播。我已经在使用带有 python-uno 的 openoffice,由于缺乏更好的工具,我将在新系统中使用它。就速度而言,它实际上并没有那么糟糕。 pdf.js 看起来不错,我现在就去看看。谢谢。
猜你喜欢
  • 1970-01-01
  • 2021-08-30
  • 1970-01-01
  • 1970-01-01
  • 2011-10-25
  • 2014-06-18
  • 1970-01-01
  • 1970-01-01
  • 2016-05-25
相关资源
最近更新 更多