【发布时间】:2011-10-05 12:43:43
【问题描述】:
我要解析的 word 文档将具有由 word 模板定义的已知格式。用户将使用单词模板来创建文档。我需要使用 C# 从 word 文档中解析数据,包括下拉列表中的值。这将在 SharePoint 2010 服务器上完成。推荐的方法是什么?我见过有人提到 Open XML SDK 2.0;我应该用那个吗?如果是这样,我是否需要将 .docx 转换为 XML,然后解析它?在某些情况下,我还必须写入 Word 文档,该怎么做?
最好有一个解决方案支持 Word 2010 和 2007,但如果 2010 的工具明显更好,我也想知道这一点。谢谢。
【问题讨论】:
-
既然我们谈论的是 Sharepoint,我会简单地使用:en.wikipedia.org/wiki/Visual_Studio_Tools_for_Office 或您自己建议的 Open XML SDK。如果您想同时支持 2010 和 2007,我会尽量避免 2010 的功能,以保持两个版本之间的兼容性。
-
@ramhound 我的困惑之一是 Word .docx 不是或看起来不像 XML 文档。它如何被 Open XML 用作一个..?对此进行研究的链接或术语?谢谢...感谢您的回复。
-
所有阅读者请注意,Visual Studio Tools for Office 使用 Word 对象模型(用于办公工具的 Word 部分)...msdn.microsoft.com/en-us/library/bb157892.aspx
-
@KyleM:它是 XML,但它被压缩以节省空间。尝试将文件扩展名更改为 .zip 并打开它。
标签: c# sharepoint-2010