【问题标题】:Is there any open source system for keyword search on XML documents? [closed]是否有任何用于 XML 文档关键字搜索的开源系统? [关闭]
【发布时间】:2010-05-27 13:12:36
【问题描述】:

我发现了很多开源 XML 数据库(TPOX、Timber、DBXML),但它们都在研究 XPath 和 XQuery,我需要一个为“XML 文档的关键字搜索”而开发的系统。

【问题讨论】:

  • 你不需要xml数据库来做关键字搜索..你只需要正则表达式。

标签: xml open-source xpath xquery keyword-search


【解决方案1】:

许多 XML 数据库都为其中的 XML 文档提供关键字索引。您不仅限于 XPath 表达式。您可以对数据库中的所有文档进行关键字搜索。

通常,您可以在 XQuery 中表达您的关键字查询(并处理查询结果)。例子见exist-db:http://exist.sourceforge.net/kwic.html

支持仅限于特定元素的关键字,或者您可以在整个文档中使用关键字。有关所有选项,请参阅 XQuery 全文规范:http://www.w3.org/TR/xpath-full-text-10/

BaseX 是另一个支持全文(即关键字搜索)规范的开源 XML 数据库:http://www.inf.uni-konstanz.de/dbis/basex/

如果您想在没有数据库的情况下进行开源全文搜索,尽管您可能想查看较旧的 XQengine - http://xqengine.sourceforge.net/ - 或者,就像其他人所说的,只需使用 Lucene 并以这种方式索引文档中的所有文本。

【讨论】:

【解决方案2】:

我不确定什么是“关键字搜索”,但您可以设置一个搜索引擎,例如 lucene/solr 来索引您的数据,然后通过它进行搜索。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2010-09-27
    • 2010-11-24
    • 1970-01-01
    • 1970-01-01
    • 2023-03-22
    • 2010-12-26
    • 2011-04-03
    • 1970-01-01
    相关资源
    最近更新 更多