【发布时间】:2015-02-25 08:09:24
【问题描述】:
我正在编写一个自定义 Lucene.NET 索引器来启用 MS Word 文档的索引。索引器必须能够处理 MS Word 的最后三个版本:2010、2007 和 2003。
计划是使用作为 VS2010 的一部分安装的 VSTO 互操作程序集从文档中提取文本内容。
有没有更好的方法来实现 Word 文档索引? 这是否意味着我必须在服务器上安装所有三个版本的 Word?还是只是 Word 2010?
工具/环境:
- Lucene.NET 2.3.1.3
- VS2010 / .NET 3.5
- Windows 2008 / IIS 7
注意:有关如何实现此功能的详细信息,请参阅Sitecore text search in PDF or Word documents
【问题讨论】:
标签: ms-word .net-3.5 vsto windows-server-2008 lucene.net