【问题标题】:Convert PDF document to Word document by programmatically without any third party tool (SSRS 2005)通过编程方式将 PDF 文档转换为 Word 文档,无需任何第三方工具 (SSRS 2005)
【发布时间】:2013-07-30 05:52:34
【问题描述】:

我正在使用 SQL Server Reporting Service 2005(SSRS 2005) 将报告导出到 Excel 和 PDF 以及 VS2008。但是现在我也想要一个导出到 Word 的选项,但是在 SSRS 2005 报告中我是在谷歌搜索后才知道的。这里的问题是我不能使用 SSRS 2008 报告。所以我想我会按照步骤来......

-- 导出到 Word

1.导出为 PDF

2。将该 PDF 转换为 Word 文档

即使经过这么多的谷歌搜索,我也没有得到正确的答案。我告诉过一次,甚至告诉过我不能使用任何第三方工具,所以不要给我错误的路径。

【问题讨论】:

    标签: c# pdf ms-word reportingservices-2005


    【解决方案1】:

    PDF 和 Word 之间存在许多根本差异,因此您想要的方法作为一般工作流程非常不受欢迎。我只举一个例子:PDF 通常不存储有关文档结构的信息——句子、段落、列、表格……它存储的只是页面上某些位置的实际文本。 Word 当然有这些概念。

    有可能做你想做的事吗?是的,在某种程度上。在一般情况下猜测和近似。如果您知道要转换哪些信息,则可以在 SSRS 生成的 PDF 文件中搜索它,然后从中生成一个 Word 文件。但是,如果 SSRS 允许导出为文本、XML、RTF 或任何其他基于结构的文件格式(尽管略微基于结构),那么您的时间会容易得多。

    如果您坚持按照您在此提出的建议,您将不得不:

    1) 编写代码以获取从 SSRS 导出的 PDF 并对其进行解释(找到您想要的文本内容)

    2) 从该信息中重新创建必要的结构信息(什么是段落,表格在哪里,什么是表格,格式是什么……)

    3) 将其写入 Word 可以读取的文件(或直接使用自动化创建新的 Word 文档)。

    这将是一个相当大的工作量,但您拥有所有必要的信息,因为 PDF 规范可从 Adob​​e 网站免费下载,它包含您需要的所有信息。

    【讨论】:

    • 谢谢大卫,但我认为这是一个漫长的过程,需要更多的时间,阅读每个段落、表格、图表是一项乏味的工作。我什至不知道所有报告的格式是否相同。有些报告可能有图表,有些可能有表格、图像和内容。那么这个问题还有其他方法吗?
    • 嗯,使用第三方工具可能会缩短路径 :-) 除此之外,就像我说的,看看您是否可以以 XML 或其他文本格式获取信息。与尝试浏览 PDF 相比,这将更容易阅读和放入 Word 文件(实际上是 PDF 中间步骤为您的程序增加了很多复杂性/时间......)。
    • Ya David,我可以从 SSRS 2005 报告生成 XML,即使问题已经提出,那么如何将 XML 转换为 Word?你能给我一个将 XML 转换为 Word 的示例代码吗?
    • 看看这个问题和答案让你开始:stackoverflow.com/questions/4686809/…
    猜你喜欢
    • 2012-07-11
    • 1970-01-01
    • 2010-09-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多