【问题标题】:parse word document解析word文档
【发布时间】:2011-10-05 12:43:43
【问题描述】:

我要解析的 word 文档将具有由 word 模板定义的已知格式。用户将使用单词模板来创建文档。我需要使用 C# 从 word 文档中解析数据,包括下拉列表中的值。这将在 SharePoint 2010 服务器上完成。推荐的方法是什么?我见过有人提到 Open XML SDK 2.0;我应该用那个吗?如果是这样,我是否需要将 .docx 转换为 XML,然后解析它?在某些情况下,我还必须写入 Word 文档,该怎么做?

最好有一个解决方案支持 Word 2010 和 2007,但如果 2010 的工具明显更好,我也想知道这一点。谢谢。

【问题讨论】:

  • 既然我们谈论的是 Sharepoint,我会简单地使用:en.wikipedia.org/wiki/Visual_Studio_Tools_for_Office 或您自己建议的 Open XML SDK。如果您想同时支持 2010 和 2007,我会尽量避免 2010 的功能,以保持两个版本之间的兼容性。
  • @ramhound 我的困惑之一是 Word .docx 不是或看起来不像 XML 文档。它如何被 Open XML 用作一个..?对此进行研究的链接或术语?谢谢...感谢您的回复。
  • 所有阅读者请注意,Visual Studio Tools for Office 使用 Word 对象模型(用于办公工具的 Word 部分)...msdn.microsoft.com/en-us/library/bb157892.aspx
  • @KyleM:它是 XML,但它被压缩以节省空间。尝试将文件扩展名更改为 .zip 并打开它。

标签: c# sharepoint-2010


【解决方案1】:

Office Open XML 的文件扩展名为 .docx。 .docx 文件可以描述为几个不同文件的存档。处理 word 文档中存在的字体、样式、对象的文件。这些文件本身将被描述为 XML。

【讨论】:

    猜你喜欢
    • 2019-01-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-07-13
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多