【发布时间】:2011-03-09 06:00:53
【问题描述】:
我需要解析一个 word 文档并从该文件中找出一些关键词。我已经通过一些解决方案来读取 doc 文件,例如使用 COM 或使用第三方工具。有没有其他方法可以不使用这两个来阅读word文档?我正在使用带有 c# 的 asp.net。
【问题讨论】:
-
您需要支持哪些版本的 Word?
-
我需要支持 MS Office 2007 和它的早期版本。
我需要解析一个 word 文档并从该文件中找出一些关键词。我已经通过一些解决方案来读取 doc 文件,例如使用 COM 或使用第三方工具。有没有其他方法可以不使用这两个来阅读word文档?我正在使用带有 c# 的 asp.net。
【问题讨论】:
您可以使用 IFilter 接口,它是 Microsoft 索引服务的一部分。它支持二进制 Word 文件。更多信息:
【讨论】:
没有亲自使用过,但http://docx.codeplex.com/ 是流行的Most useful free .NET libraries? 帖子上推荐的 Word Doc Manipulation Libraries 之一
【讨论】: