【发布时间】:2011-12-17 10:44:58
【问题描述】:
我想在 c# 中读取一个 docx 文件。 将 docx 文件转换为 .zip 时会生成我们文件的 xml。 我想阅读那个 xml 文件。 我需要文档中带有字体名称(粗斜体设置)的所有数据,文件中的颜色。 我们该怎么做?
【问题讨论】:
标签: c# xml ms-word office-interop docx
我想在 c# 中读取一个 docx 文件。 将 docx 文件转换为 .zip 时会生成我们文件的 xml。 我想阅读那个 xml 文件。 我需要文档中带有字体名称(粗斜体设置)的所有数据,文件中的颜色。 我们该怎么做?
【问题讨论】:
标签: c# xml ms-word office-interop docx
低级答案:DOCX 文件是 OPC(开放打包约定)格式(带有清单的 zip 文件),可以使用 System.IO.Packaging 命名空间中可用的类打开。
高级答案:DocX 是一个开源框架,支持使用高级构造操作 DOCX 文件。
【讨论】:
The format of DOCX is well documented. 要读取包,您可以使用System.IO.Packaging 命名空间中的类。
【讨论】:
您将使用 Microsoft Office 12.0 对象库
【讨论】:
如果您能够以 XML 格式读取文件,那么您可以应用一些 XPATH 查询来获取您需要的信息。
【讨论】: