【问题标题】:Pdf processing and manipulation online [closed]在线PDF处理和操作[关闭]
【发布时间】:2015-04-20 10:11:47
【问题描述】:

我想在线显示一个 pdf 文件,并在点击 pdf 中的单词时提供翻译。 Pdf 来自用户,我没有任何标记。如果有翻译的 pdf 可用,我想在点击原始 pdf 中的句子/单词时显示翻译 pdf 的片段。如果翻译不在 pdf 文件中,我会将其显示为文本覆盖。我有哪些可能性?
我可以想象以下解决方案:

  1. 没有对原始 pdf 进行修改,点击句子时会出现覆盖。 Adobe Pdf Reader 可能无法使用,是否有可用的服务器端阅读器,我可以在其中执行此类操作(处理点击、获取点击文本、sdd 覆盖)?
  2. 将 pdf 转换为 html - 我可以在服务器端使用哪个转换器? (首选 PHP)
  3. 为浏览器创建自定义 pdf 阅读器 - 太复杂了
  4. ??

有什么建议吗?

【问题讨论】:

    标签: php pdf pdf-generation pdfbox pdf-parsing


    【解决方案1】:

    我会考虑以下场景:

    1. 使用PDF.js 在浏览器中显示 PDF(它工作得很好,例如,DropBox 已经使用它来显示 PDF 预览)。并调整其查看器 HTML 和 javascript 代码以处理文本选择(参见 example)。缺点:它可能无法在移动设备上正常运行。
    2. 使用带有服务器端代码的成熟 pdf 到 html 转换器(商业或非商业)之一将 PDF 转换为 HTML 表示。然后像 HTML 代码一样使用它。
    3. 使用服务器端代码将 PDF 转换为图像(每页单个图像)。然后解析 PDF 以查找每个文本对象的位置并生成 HTML 代码以使用渲染图像,最后生成 HTML 代码,其中渲染图像位于底层,顶层包含由您的 javascript 代码处理的文本元素以显示翻译等.

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2020-01-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-08-13
      • 2014-02-24
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多