【发布时间】:2010-05-27 13:12:36
【问题描述】:
我发现了很多开源 XML 数据库(TPOX、Timber、DBXML),但它们都在研究 XPath 和 XQuery,我需要一个为“XML 文档的关键字搜索”而开发的系统。
【问题讨论】:
-
你不需要xml数据库来做关键字搜索..你只需要正则表达式。
标签: xml open-source xpath xquery keyword-search
我发现了很多开源 XML 数据库(TPOX、Timber、DBXML),但它们都在研究 XPath 和 XQuery,我需要一个为“XML 文档的关键字搜索”而开发的系统。
【问题讨论】:
标签: xml open-source xpath xquery keyword-search
许多 XML 数据库都为其中的 XML 文档提供关键字索引。您不仅限于 XPath 表达式。您可以对数据库中的所有文档进行关键字搜索。
通常,您可以在 XQuery 中表达您的关键字查询(并处理查询结果)。例子见exist-db:http://exist.sourceforge.net/kwic.html
支持仅限于特定元素的关键字,或者您可以在整个文档中使用关键字。有关所有选项,请参阅 XQuery 全文规范:http://www.w3.org/TR/xpath-full-text-10/
BaseX 是另一个支持全文(即关键字搜索)规范的开源 XML 数据库:http://www.inf.uni-konstanz.de/dbis/basex/
如果您想在没有数据库的情况下进行开源全文搜索,尽管您可能想查看较旧的 XQengine - http://xqengine.sourceforge.net/ - 或者,就像其他人所说的,只需使用 Lucene 并以这种方式索引文档中的所有文本。
【讨论】:
我不确定什么是“关键字搜索”,但您可以设置一个搜索引擎,例如 lucene/solr 来索引您的数据,然后通过它进行搜索。
【讨论】: