【问题标题】:PDF to DOM conversion using javascript使用 javascript 将 PDF 转换为 DOM
【发布时间】:2011-12-19 20:53:10
【问题描述】:

我已经研究了很长一段时间,我所能发现的只是这个pdf2dom 解析器,并且可能是this 的逆向工程版本。无论如何,这是我的问题。对于任何渲染引擎,它的输入应该是数据流(在我的例子中是 pdf 内容),它的输出应该是选定的格式(在我的例子中是 DOM、HTML 和 CSS)。

  1. 但是,不是使用 java 或 c++,我是否有可能从服务器获取“pdf 数据”流(这是我不知道的)并存储到 javascript 变量中并使用 javascript渲染它并将其附加到DOM?

  2. 原始“pdf 数据”如何显示(是否有任何特定格式.. 等)?

欢迎所有意见。

注意:应该与 IE 兼容。

【问题讨论】:

    标签: javascript pdf pdf-conversion


    【解决方案1】:

    已经完成了。结果是pdf.js。请注意,它是通过将 PDF 渲染到画布上来工作的。这样可以保证结果; PDF 的某些功能目前无法在画布之外实现。

    【讨论】:

    • 嘿,真好,不知道这个项目。
    • 对不起。我的错。我确实遇到过这个问题,但是画布不是我的选择,因为我必须支持 ie 6,7,8 太 X-D,因此我必须自己进行渲染。生病更新我的问题。 +1,因为这是下一个最好的事情。
    • @Astroth:您可以尝试将它与ExplorerCanvas 一起使用。它不会是完美的,但我认为它可能会做一个一般可以通过的工作。无论如何,我想在不使用画布的情况下也能做到最好。
    • 嗯.. excanvas 嗯?是的,我会试一试。
    【解决方案2】:

    PDF 通常是 PostScript + 选项的子集,用于嵌入 Flash、JavaScript 和各种其他内容。

    将 PDF 简单地翻译成 HTML (/DOM),并让它以正确的方式呈现几乎是不可能的。例如,PDF 使用 JPEG 图像,但这里和那里有细微的变化,这意味着您必须先转换它们才能在其他任何地方使用。尝试阅读 PDF.js-guys 的一些演示文稿,您会发现相当长的 WTF 列表。

    但是,如果您只有简单的 PDF(纯文本;没有图像等)并且除了最简单的布局之外不关心保留任何内容,您应该能够从 PDF 中刮出字符串数据并将其放入进入 DOM。

    然而,就我个人而言,我认为强制用户拥有插件(flash/acrobat/...)或渲染 PDF 的服务器端并将它们作为图像提供给浏览器会更简单。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-06-28
      • 2019-05-11
      • 1970-01-01
      • 2014-10-11
      • 2014-11-23
      • 2022-12-01
      • 2016-11-12
      • 2018-03-28
      相关资源
      最近更新 更多