【问题标题】:Implementing search functionality using sphnix使用 sphinx 实现搜索功能
【发布时间】:2013-12-03 11:58:20
【问题描述】:

我需要为我的项目实现搜索功能。在探索了一些全文搜索引擎之后。我发现 sphinx 搜索适合我的项目。

经过一番了解后,我发现我需要将要搜索的数据提供给 DB,然后索引器从 Db 中提取数据并构建索引。之后 searchd 使用该索引来回答查询。我很难在我的 Ubuntu 中安装它机器,然后我不知道如何继续。我没有找到任何示例项目来查看。我有 html 文件列表,用于搜索用户给出的关键字。

我的第一个问题是

1) 有没有完整的 sphinx 搜索实现指南?

2) 如何将 html 文件插入 Db。sphnix 是否支持通过 html 文件搜索?

3) 我的项目完全只使用 javascript 完成。目前还没有服务器端。要集成 将此搜索功能添加到我的项目中。我需要使用任何 API 与主代码进行通信吗?

抱歉,问了这么久,问了太多问题。作为初学者程序员,搞清楚所有这些似乎很难。

谁能帮我解决这个问题?

提前致谢。

【问题讨论】:

    标签: search full-text-search sphinx


    【解决方案1】:
    1. 并非如此。因为它永远无法涵盖所有​​要点。该手册有很好的安装指南,否则请上网查找教程。

    2. 您不必将它们插入数据库。 Sphinx 可以索引其他来源。特别是 TSV 或 XML 文件。甚至是只输出用于索引的 XML 的脚本(因此它读取文件,并输出 Sphinx 索引的新 XML)或者您可以将文件名插入数据库,然后 sphinx 可以从文件本身中获取内容。

      或者可以使用实时索引,您可以将数据直接“插入”到狮身人面像索引中,不需要中间数据库/文件等

      是的,sphinx 可以直接索引 html 内容 - 它可以剥离原始 HTML,只留下要索引的文本 strip_html

    3. 是的,sphinx 需要在服务器上运行。

      如果您的数据量不大(几 MB),可以只在客户端上建立索引 - 客户端必须下载的索引会很小。 https://github.com/reyesr/fullproof

      也可以使用类似http://indexden.com/ 的东西,它提供“sphinx as a service”:)

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-07-18
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多